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Zusammenfassung 


Die fertigende Industrie wird mit einer komplexen Wettbewerbssituati- 
on, globalisierten Märkten und kurzen Innovationszyklen konfrontiert. 
Gleichzeitig ist sie einem großen Kostendruck und teurer werdenden 
Ressourcen ausgesetzt. Diesen Herausforderungen kann sie begegnen, 
indem sie erstens auf individuelle Kundenanforderungen eingeht, zwei- 
tens Ressourcen sparsam einsetzt und drittens bereits kleine Losgrößen zu 
günstigen Preisen produziert. Laserschneiden von Metallen ist ein weit 
verbreiteter Fertigungsprozess. Obwohl er aufgrund seiner hohen Flexi- 
bilität dazu prädestiniert ist, diese Anforderungen zu erfüllen, gibt es 
hier noch immer ein erhebliches Verbesserungspotential. Dieses wird in 
der vorliegenden Arbeit identifiziert und anschließend mit Methoden des 
maschinellen Lernens (ML) adressiert. 

Als Grundlage wurde eine breite Datenbasis aus fast 4000 Schnittkanten 
durch die Variation vier dominanter Prozessparameter generiert. Zu jeder 
Schnittkante sind die verwendeten Prozessparameter, die zugehörigen 
RGB-Bilder und 3D-Punktwolken sowie die daraus abgeleiteten objektiven 
Qualitätsmerkmale vorhanden. Da die 3D-Punktwolken fehlerbehaftet 
sind, wurden verschiedene Methoden zur Verbesserung der Datenqualität 
erprobt. 

Damit individuelle Anforderungen an die Schnittqualität formuliert 
und überprüft werden können, ist eine objektive und überprüfbare Qua- 
litätsdefinition nötig. Die nach Norm vorgeschriebenen Größen können 
jedoch nur mit einem Oberflächenmessgerät bestimmt werden. Da ein 
solches Messgerät in der Produktion meist nicht vorhanden ist, wird die 
Qualität bisher subjektiv durch den Menschen beurteilt. Inwieweit eine 
Einzelperson in der Lage ist, diese Beurteilung durchzuführen und wel- 
che Merkmale der Schnittkante für den Menschen besonders relevant 
sind, wurde mithilfe einer Expertenbefragung evaluiert. Am Beispiel der 
Rautiefe wurde gezeigt, dass die Normgrößen anstatt mit einem teuren 
Messgerät auch mit einem faltenden neuronalen Netz (engl. convolutional 
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neural network, CNN) aus RGB-Bildern abgeleitet und so im Produktions- 
alltag zur Verfügung gestellt werden könnten. 

Ressourcen- und kostensparend zu produzieren bedeutet unter ande- 
rem, Ausschuss zu vermeiden und Maschinenstillstandszeiten sowie die 
Notwendigkeit menschlicher Eingriffe zu minimieren. Die bisherige ma- 
nuelle Überprüfung des Zustands einer Laserschneidmaschine entspricht 
diesen Anforderungen aber keineswegs. Deshalb wurde ein Konzept ent- 
wickelt, mit dem der Maschinenzustand zuverlässig und automatisiert 
überprüft werden kann. Die entscheidende Information liefern die Ist- 
Prozessparameter. Diese werden mithilfe eines eigens entwickelten CNNs 
aus dem RGB-Bild der Schnittkante abgeleitet. Aus der Differenz zwischen 
den Ist- und den eingestellten Soll-Parametern kann auf Probleme in der 
Maschine geschlossen werden. Da der Mensch nicht in der Lage ist, die 
Ist-Prozessparameter zu identifizieren, zeigt dieses Beispiel eindrucksvoll 
das Potential datenbasierter Methoden im Laserschneiden. 

Kleine Stückzahlen günstig herzustellen ist nur möglich, wenn man den 
Gesamtprozess mit allen Einflussgrößen vollständig beherrscht. Aufgrund 
der enormen Komplexität des Laserschneidprozesses sollte der Mensch 
durch Modellierungswerkzeuge unterstützt werden. Trotz der jahrzehnte- 
langen Forschung finden diese (meist analytischen oder numerischen Mo- 
delle) nahezu keine Anwendung in der Praxis. Stattdessen ist der Mensch, 
z.B. bei der Ermittlung geeigneter Prozessparameter, auf sich allein gestellt. 
In dieser Arbeit wurde der Zusammenhang zwischen den variierten Pro- 
zessparametern und drei relevanten Größen, Fehlschnittrisiko, Rautiefe 
und Grathöhe, analysiert und modelliert. Des Weiteren wurden CNNs, 
welche die Zusammenhänge zwischen einem Bild der Schnittkante und 
jeweils einem der Prozessparameter erlernt hatten, visualisiert. Die für 
die Entscheidungen des jeweiligen CNNs besonders relevanten Merkmale 
des Eingangsbildes wurden mithilfe der sogenannten Layer-wise Rele- 
vance Propagation (LRP) sichtbar gemacht. Die Visualisierung kann die 
Akzeptanz des Einsatzes künstlicher neuronaler Netze verbessern und 
gleichzeitig dazu beitragen, das Prozessverständnis zu erweitern. 
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1 Einleitung 


Die Idee, Materialien mit Licht zu bearbeiten, hat Menschen seit dem Tag 
fasziniert, als sie das erste Mal Papier mit Hilfe des Sonnenlichts und 
einer Lupe verbrannten. Heutzutage wird zur Materialbearbeitung oft 
Laserstrahlung eingesetzt. 

Das Prinzip der Erzeugung von Laserstrahlung wurde bereits 1917 
durch Albert Einstein postuliert [Ein17] und ungefähr 40 Jahre später 
durch Theodore Maiman mit einem ersten Prototypen des Lasers in die 
Tat umgesetzt [Mai60]. Damit hat eine Erfolgsgeschichte begonnen, die 
bis heute nicht abgeschlossen ist. Neben der Erforschung, Weiterentwick- 
lung und Anwendung des Lasers in der Wissenschaft hat er sich in vielen 
anderen Bereichen etabliert. Heute sind Laser aus der Industrie (z. B. Laser- 
schweißen von Karosserieteilen), der Medizin (z. B. refraktive Chirurgie), 
der Informationstechnologie (z. B. Glasfaser-Internet) und aus unserem 
Alltag (z. B. Laserdrucker) nicht mehr wegzudenken. 

Ungefähr ein Drittel aller weltweit verkauften Laser werden in der 
Materialbearbeitung eingesetzt. 2015 wurde mit Lasern für die Materialbe- 
arbeitung ein Umsatz von 3,8 Mrd. US-Dollar erzielt, 2018 waren es bereits 
5,6 Mrd. US-Dollar. Den davon mit Abstand größten Anteil von 35% 
machen Laserschneidprozesse aus. Weitere häufige Anwendungen sind 
Schweißen (16 %), Markieren (15%) und die Herstellung von Halbleitern 
und Displays (14 %). [Kin+18] 

Beim Laserschneiden von Metallen wird das Werkstück durch einen 
fokussierten Laserstrahl erhitzt und geschmolzen oder verdampft. Gleich- 
zeitig wird das geschmolzene Material mithilfe des sogenannten Schneid- 
gases entfernt. Durch die Relativbewegung zwischen Laserstrahl und 
Werkstück entsteht ein Schnittspalt. Die resultierende Schnittkante hängt 
von den Prozessparametern, dem Zustand der Laserschneidmaschine und 
den Materialeigenschaften des Werkstücks ab [SM10]. Zwei exemplarische 
Schnittkanten sind in Abbildung 1.1 vor einem schwarzen Hintergrund zu 
sehen. In beiden Fällen handelt es sich um ein 3mm dickes Edelstahlblech. 


1 Einleitung 


— 1 mm — 1mm 


(a) Glatte Schnittkante ohne Grat. (b) Raue Schnittkante mit dickem Grat. 


Abbildung 1.1 Zwei unterschiedliche Laserschnittkanten. 


Aufgrund unterschiedlich eingestellter Prozessparameter ist die in Abbil- 
dung 1.1(a) gezeigte Schnittkante glatt, die in Abbildung 1.1(b) gezeigte 
Kante weist dagegen eine raue Oberfläche und einen sogenannten Grat an 
der Unterseite auf. 

Beim Laserschneiden handelt es sich um ein sehr etabliertes Fertigungs- 
verfahren, das seit Jahrzehnten industriell eingesetzt wird. Umso überra- 
schender ist es, dass dieser Prozess noch nicht vollständig verstanden ist 
[HG09; PSW12; SM10]. Bis heute wird an der Modellierung und Optimie- 
rung des Prozesses geforscht. Bei den eingesetzten Modellen handelt es 
sich nahezu ausschließlich um physikalisch motivierte Modelle, die mit 
analytischen und klassischen numerischen Methoden entwickelt wurden. 
Aufgrund der enormen Komplexität des Schneidprozesses, die sich aus 
dem Zusammenspiel verschiedener physikalischer Prozesse und der Viel- 
zahl an Einflussgrößen ergibt (siehe Abschnitt 2.1), modellieren sie nur 
Teilaspekte und basieren auf vielen vereinfachenden Annahmen. Diese Be- 
trachtung ist der Erweiterung des Prozessverständnisses dienlich, für die 
Praxis jedoch wenig hilfreich. Methoden des maschinellen Lernens finden 
kaum Anwendung, obwohl sie geradezu prädestiniert für die Modellie- 
rung komplexer Zusammenhänge sind. Angesichts fehlender Alternativen 
verlässt man sich in der Praxis weitestgehend auf den Menschen: 


= Die Qualität einer Schnittkante wird durch Anfassen und Anschau- 
en und nicht basierend auf gemessenen Kriterien beurteilt. 


= Der Zustand einer Laserschneidmaschine, welcher große Auswir- 
kungen auf den Schneidprozess haben kann, wird manuell durch 
Prüfen verschiedener Einzelkomponenten kontrolliert. Dies führt 
zu langen Maschinenstillstandszeiten. 


1 Einleitung 


= Um neue Prozessparameter (z.B. für eine höhere Laserleistung) 
zu ermitteln oder bestehende zu optimieren, werden aufwendige 
experimentelle Untersuchungen durchgeführt, die viel Vorwissen 
und Erfahrung erfordern. 


Dieses Vorgehen wird vor dem Hintergrund der veränderten Anforde- 
rungen an die fertigende Industrie immer problematischer. Diese wird 
mit einer komplexen Wettbewerbssituation, globalisierten Märkten und 
kurzen Innovationszyklen konfrontiert [LRZ06]. Gleichzeitig ist sie einem 
großen Kostendruck und teurer werdenden Ressourcen ausgesetzt, wie 
Brecher und Özdemir [BÖ15] schreiben. Die Autoren schlagen vor, diesen 
Herausforderungen mit 


= dem Eingehen auf individuelle Anforderungen, 
= einer sparsamen Ressourcennutzung und 
= dem Fertigen kleiner Losgrößen zu günstigen Preisen 


zu begegnen. Obwohl das Laserschneiden wegen seiner Flexibilität gerade- 
zu prädestiniert für die Erfüllung dieser Anforderungen ist, können sie mit 
der aktuellen Vorgehensweise nicht bewältigt werden. Solange es keine 
objektive, überall anwendbare Definition der Schnittqualität gibt, kön- 
nen kundenspezifische Anforderungen nicht berücksichtigt werden. Res- 
sourcensparend zu produzieren bedeutet unter anderem, Ausschuss und 
Maschinenstillstandszeiten zu vermeiden und menschliche Eingriffe zu 
minimieren. Die manuelle Überprüfung des Zustands einer Laserschneid- 
maschine entspricht dieser Anforderung keineswegs. Kundenspezifische 
Produkte in kleinen Stückzahlen und gleichzeitig zu günstigen Preisen zu 
produzieren, ist nur möglich, wenn man den Gesamtprozess vollständig 
beherrscht. Aufgrund der großen Komplexität sollte der Mensch dabei 
von Modellierungswerkzeugen unterstützt werden. 

In dieser Arbeit werden die obenstehenden Probleme mithilfe von Me- 
thoden des maschinellen Lernens adressiert. Mit dieser Methodik wurden 
in den letzten Jahren große Erfolge in verschiedensten Anwendungsbe- 
reichen erzielt. Für die Modellierung des Laserschneidprozesses wird sie 
jedoch noch kaum eingesetzt. 


1 Einleitung 


1.1 Problemstellung und eigener Beitrag 


Um Methoden des maschinellen Lernens einsetzen zu können, benötigt 
man eine Datenbasis. Da es für das Laserschneiden keine öffentlich verfüg- 
baren Daten gibt, wurde im Rahmen dieser Arbeit eine Datengrundlage 
geschaffen. 


Eigener Beitrag Es wurde eine große Datenbasis bestehend aus 3596 
Laserschnittkanten mit ganz unterschiedlichen Schnittbildern generiert 
(siehe Kapitel 4). Von jeder Schnittkante wurden RGB-Bilder und 3D- 
Punktwolken aufgenommen. Aus letzteren konnten verschiedene objek- 
tive Qualitätsmerkmale berechnet werden. Durch die Verwendung einer 
modernen Laserschneidmaschine mit einem Festkörperlaser können die 
Herausforderungen (z.B. durch Prozessstreuungen) in der Praxis realis- 
tisch eingeschätzt werden. Neben einer Analyse der Datenqualität wurden 
Methoden zur Verbesserung derselben evaluiert (siehe Abschnitt 6.1). Die 
Größe der Datenbasis ermöglicht das Training tiefer neuronaler Netze mit 
Bildern als Eingangsdaten, was völlig neue Anwendungsmöglichkeiten 
eröffnet. Damit kann erstmalig das große Potential datenbasierter Metho- 
den im Laserschneiden gezeigt werden. 


Im Folgenden wird für jede der drei oben genannten Anforderungen an die 
fertigende Industrie aufgezeigt, welche Probleme aus dem aktuellen Stand 
der Technik und dem Vorgehen in der Praxis resultieren. Anschließend 
wird der eigene Beitrag zur Adressierung dieser Probleme dargestellt. Das 
Gesamtkonzept der Arbeit ist in Abbildung 1.2 zusammengefasst. 


1.1.1 Qualitätsbeurteilung 
Zur Formulierung und Überprüfung individueller, kundenspezifischer 


Anforderungen wird eine objektive Qualitätsdefinition benötigt. 


Stand der Technik Die Norm DIN EN ISO 9013 [Deu17] definiert zwei 
obligatorische Qualitätskriterien für Laserschnittkanten: gemittelte Rautie- 
fe Rz5 und Rechtwinkligkeitstoleranz u. In der Literatur wird die Rautiefe 
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Eigener Beitrag: ener Beitrag: | Eigener Beitrag: 

Expertenbefragung Konzept zur Modellierung und 
Uberpriifung des Visualisierung des 

Zusammenhang gesamten Maschinen- Zusammenhangs 

zwischen menschlichem zustands anhand eines zwischen Prozess- 

Urteil und objektiven Bildes parametern und 

Merkmalen Qualitat bzw. Stabilitat 
Bildbasierte Regression 

Bildbasierte Schätzung der Prozessparameter Visualisierung der 

der Rautiefe mit einem mit einem CNN durch ein CNN 

CNN erlernten Zusammen- 


Abbildung 1.2 Gesamtkonzept der Arbeit. Das Ziel sind Verbesserungen im Laserschneiden 
hinsichtlich der drei Anforderungen: individuelle Produkte, Ressourcen sparen und kleine 
Losgrößen günstig herstellen. 


1 Einleitung 


häufig mit der Schnittkantenqualität gleichgesetzt (z. B. [Ter+16]). Für die 
Ermittlung der Normgrößen ist ein Oberflächenmessgerät nötig. 


Vorgehen in der Praxis In der Praxis ist meist kein Messgerät zur Be- 
stimmung der Normgrößen vorhanden. Die Qualität einer Schnittkante 
wird vom Menschen durch Anschauen und Anfassen beurteilt. Mit jeder 
Laserschneidmaschine werden Parametertabellen ausgeliefert, in denen 
geeignete Prozessparameterkombinationen für häufig verwendete Mate- 
rialien und Blechdicken zu finden sind. 


Problemstellung Da objektive Qualitätsmerkmale in der Praxis nicht 
ermittelt werden können, wird die Schnittkantenqualität subjektiv von 
Einzelpersonen bewertet. Diese Qualitätsbeurteilung ist äußerst intrans- 
parent, der Zusammenhang zwischen der menschlichen Beurteilung und 
den Normgrößen ist unklar. Individuelle Anforderungen und Präferenzen 
können so weder formuliert noch überprüft werden. 

Für die Bereitstellung der Parametertabellen wird ein allgemein gültiges 
Qualitätsverständnis angenommen - über verschiedene Branchen, Produk- 
te und Märkte hinweg. Parameteranpassungen aufgrund abweichenden 
Qualitätsvorstellungen können nur mit einem hohen manuellen Aufwand 
und Expertenkenntnissen vorgenommen werden. 


Eigener Beitrag Anhand einer Expertenbefragung werden die Probleme 
des bisherigen Vorgehens in der Praxis aufgezeigt (siehe Abschnitt 6.2.1). 
Im Rahmen der Befragung wurden 100 Schnittkanten von jeweils fünf 
Personen bewertet. Damit die subjektive Qualitätsbeurteilung in der Pro- 
duktion durch eine wichtige objektive Größe ergänzt werden kann, wurde 
ein CNN entwickelt, mit dem die Rautiefe basierend auf einem RGB-Bild 
geschätzt werden kann (siehe Abschnitt 6.2.2). Dafür ist kein spezielles 
Messgerät erforderlich. Eine Alternative zu den Parametertabellen wird in 
Abschnitt 1.1.3 erwähnt. 


1.1.2 Überprüfung des Maschinenzustands 


Eine zuverlässige und automatisierte Überprüfung des Maschinenzu- 
stands hilft dabei, ressourcenschonend zu produzieren. 


1.1 Problemstellung und eigener Beitrag 


Stand der Technik Laserschneidmaschinen können prinzipiell durch 
automatisierte Belade- und Entladesysteme mit wenigen menschlichen 
Eingriffen betrieben werden, solange keine Probleme auftreten. Eine La- 
serschneidmaschine setzt sich aus vielen verschiedenen Einzelkomponen- 
ten zusammen, die teilweise mit Sensorik überwacht werden. Ein klar 
definierter Maschinenzustand ist die Grundvoraussetzung für die Be- 
herrschbarkeit des Laserschneidprozesses und für die Gültigkeit jeglicher 
Modelle und Prozessparametertabellen, weil etwaige Störgrößen nur dann 
beherrschbar sind. 


Vorgehen in der Praxis Aufgrund der Vielzahl möglicher Ursachen und 
der Komplexität des Schneidprozesses sind Menschen nicht in der Lage, 
von einer fehlerhaften Schnittkante auf die Ursache zu schließen. Bei Pro- 
blemen wird deshalb zunächst der Maschinenzustand überprüft, indem 
eine Maschinenkomponente nach der anderen manuell kontrolliert wird. 
Die Sensorik unterstützt dabei, gibt aber nur den Zustand einer Kompo- 
nente, z.B. den Verschmutzungsgrad, an und nicht die Auswirkungen 
auf den Gesamtprozess. Da die Überprüfung nicht im laufenden Betrieb 
erfolgen kann, kommt es zu längeren Maschinenstillstandszeiten. Wenn 
die Schneidprobleme durch die Wartung der Maschine nicht behoben wer- 
den können, müssen in einem zweiten Schritt die Soll-Prozessparameter 
optimiert werden. 


Problemstellung Bislang existiert keine Möglichkeit, den Zustand des 
Gesamtsystems automatisiert zu überprüfen und ein vorausschauendes 
Eingreifen ist nicht möglich. Das verringert die Produktivität (d.h. die 
Teileanzahl pro Zeit) der Maschine und kann Ausschuss oder einen hohen 
Nachbearbeitungsaufwand verursachen. 


Eigener Beitrag Es wurde ein neues Konzept zur Überprüfung des Ma- 
schinenzustands entwickelt: Die Ist-Prozessparameter werden mithilfe 
eines eigens entwickelten CNNs aus dem RGB-Bild der Schnittkante abge- 
leitet (siehe Abschnitt 6.3.1). Aus der Differenz zwischen den so ermittelten 
Ist- und den eingestellten Soll-Parametern kann schneller auf Defekte oder 
Verschmutzungen in der Maschine geschlossen werden. Vorausschauende 
Wartung könnte durch eine permanente, automatisierte Überwachung 


1 Einleitung 


der Maschine und durch die Detektion kleinster Veränderungen realisiert 
werden. 

Es sind keine Arbeiten bekannt, in denen von der Schnittkante auf die 
zugrunde liegenden Parameter geschlossen wird. Da der Mensch zu die- 
sem Rückschluss aufgrund der Komplexität des Prozesses nicht in der 
Lage ist, glauben viele, dass es gar keinen eindeutigen Zusammenhang 
gibt. Während oft versucht wird, mittels künstlicher Intelligenz (KI) an 
die Leistungsfähigkeit des Menschen heranzukommen (z.B. bei der Ge- 
sichtserkennung), wurde hier ein Zusammenhang modelliert, der für den 
Menschen unverständlich ist. 


1.1.3 Erweiterung des Prozessverständnisses 


Um ab dem ersten Teil zu günstigen Preisen zu produzieren, ist die voll- 
ständige Beherrschung des Produktionsprozesses unabdingbar. 


Stand der Forschung — Laserschneiden Neben den oben erwähnten 
physikalisch motivierten Modellansätzen werden seit einigen Jahren auch 
Methoden des maschinellen Lernens eingesetzt. Allerdings handelt es sich 
dabei meist um einfache Modelle wie Entscheidungsbäume oder neuro- 
nale Netze mit einer lediglich einstelligen Anzahl verdeckter Neuronen. 
Diese werden, analog zu den analytischen oder numerischen Ansätzen, 
eingesetzt, um die Zusammenhänge zwischen verschiedenen Prozesspa- 
rametern und einzelnen Qualitätskriterien zu modellieren. Als Trainings- 
daten werden entweder Simulationsdaten oder experimentell generierte 
Datensätze mit weniger als 50 Beispielen verwendet. 


Vorgehen in der Praxis Die Ermittlung neuer und die Anpassung beste- 
hender Prozessparameter erfolgen manuell und erfordern viel Erfahrung 
und Zeit. Deshalb werden die bereits erwähnten Parametertabellen ange- 
boten. 


Stand der Technik — Maschinelles Lernen Das Thema künstliche Intel- 
ligenz ist medial sehr präsent und Methoden des maschinellen Lernens, 
insbesondere künstliche neuronale Netze, erzielten große Erfolge in ver- 
schiedensten Bereichen wie z.B. dem autonomen Fahren [Al-+17] und 


1.1 Problemstellung und eigener Beitrag 


der Medizin [Est+17]. Im Produktionskontext werden faltende neurona- 
le Netze beispielsweise zur Erkennung und Lokalisierung von Defekten 
[Lin+19], zur vorausschauenden Wartung [KC19] und zur Ermittlung von 
Oberflächenkenngrößen [Sun+18] eingesetzt. Als Eingangsdaten werden 
meist zeitabhängige Sensorsignale oder Bilder verwendet. Eine grundsätz- 
liche Herausforderung tiefer neuronaler Netze ist die Interpretierbarkeit 
der erlernten Zusammenhänge. 


Problemstellung Die enormen Fortschritte, die in vielen Bereichen mit 
Methoden des maschinellen Lernens erzielt wurden, kommen beim Laser- 
schneiden nicht an. Datenbasierte Methoden entfalten ihr Potential vor 
allem bei der Verwendung komplexer, nicht linearer Modelle (z. B. tiefer 
neuronaler Netze) in Kombination mit einer breiten Datenbasis. 

Da bestehende Modelle praxisrelevante Fragestellungen nur unzurei- 
chend beantworten, verlässt man sich vollständig auf die Parametertabel- 
len und auf erfahrene Fachkräfte. Die Tabellen führen jedoch oft zu nicht 
zufriedenstellenden Ergebnissen. Wegen des manuellen Vorgehens bleibt 
der Aufwand für die Ermittlung neuer Parameter immer derselbe. 


Eigener Beitrag Die Erweiterung des Prozessverständnisses und die 
Unterstützung des Menschen durch die Bereitstellung nützlicher Infor- 
mationen und geeigneter Modellierungswerkzeuge sind die zentralen 
Themen dieser Arbeit und finden sich in vielen Teilaspekten wieder. 

Am Beispiel von CNNs, die den Zusammenhang zwischen einem Bild 
der Schnittkante und jeweils einem der Prozessparameter erlernt haben, 
wird gezeigt, dass sich die Verwendung datenbasierter Modelle und die 
Erweiterung des Verständnisses nicht ausschließen. Eine geeignete Visuali- 
sierungstechnik kann die Akzeptanz künstlicher neuronaler Netze stärken, 
das Prozessverständnis erweitern und den Menschen bei der Lösung von 
Schneidproblemen unterstützen (siehe Abschnitt 6.4.1). 

Die Zusammenhänge zwischen den Prozessparametern und der Prozess- 
stabilität sowie mehreren Qualitätsmerkmalen der Schnittkante werden 
analysiert und modelliert (siehe Abschnitte 6.4.2, 6.4.3, 6.4.4). Diese Model- 
le könnten die Grundlage für die individuelle Optimierung des Prozesses 
bilden. 
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1.2 Struktur der Arbeit 


Die vorliegende Arbeit ist wie folgt aufgebaut. Kapitel 2 erläutert die 
Grundlagen des Laserschneidens und die objektiven Kriterien zur Beurtei- 
lung der Schnittkantenqualität. Es wird auf den Stand der Wissenschaft be- 
züglich der Modellierung des Laserschneidprozesses eingegangen. Dabei 
werden physikalisch motivierte und datenbasierte Modellansätze unter- 
schieden. Die in der Praxis üblichen Vorgehensweisen für die Beurteilung 
der Schnittqualität, die Überprüfung des Maschinenzustands und die 
Ermittlung neuer bzw. die Optimierung bestehender Prozessparameter 
werden erklärt. Die aktuellen Herausforderungen und die daraus abge- 
leiteten notwendigen Veränderungen im Zuge der vierten industriellen 
Revolution werden thematisiert. Zum Abschluss des Kapitels wird disku- 
tiert, warum datenbasierte Methoden im Laserschneiden bislang kaum 
eingesetzt werden. Anschließend folgen im Kapitel 3 die Grundbegriffe 
des maschinellen Lernens, ergänzt durch eine Einführung in faltende neu- 
ronale Netze und Autoencoder (AE). Es wird auf den Stand der Technik 
von ML-Anwendungen im industriellen Umfeld eingegangen und auf den 
Stand der Forschung zur Interpretierbarkeit neuronaler Netze. Kapitel 4 
stellt die Datenbasis vor. Es wird erklärt, mit welchen Prozessparametern 
die verschiedenen Schnittkanten generiert wurden, wie sie vermessen 
und die RGB-Bilder aufgenommen wurden. Ein Abschnitt widmet sich 
verschiedenen Methoden zur Korrektur von Rautiefenmessfehlern. Au- 
ßerdem wird das Konzept der Expertenbefragung erläutert. In Abschnitt 
4.5 befindet sich ein Überblick über die verfügbaren Daten. In Kapitel 5 
werden die entwickelten CNN-Architekturen und die Visualisierungstech- 
nik Layer-wise Relevance Propagation vorgestellt. Die Ergebnisse werden 
in Kapitel 6 präsentiert. Das Kapitel ist entsprechend der Themenblöcke 
in Abschnitt 1.1 gegliedert. Kapitel 7 fasst die wichtigsten Ergebnisse 
zusammen und schließt die Arbeit mit einem Ausblick ab. 

Im Kontext des maschinellen Lernens sind die geläufigen Begriffe häufig 
englisch. Es wird versucht, deutsche Übersetzungen zu verwenden, sofern 
der Bezug zum englischen Fachbegriff klar ersichtlich bleibt. In allen 
anderen Fällen werden die Originalbegriffe wie deutsche Worte verwendet 
und bei ihrer ersten Nennung übersetzt bzw. erklärt. 
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2 Laserschneiden von Metallen 


In diesem Kapitel werden zunächst die Grundlagen des Laserschneidens 
erläutert. Anschließend wird darauf eingegangen, wie die Qualität einer 
Laserschnittkante beurteilt wird. Der Stand der Technik bei der Modellie- 
rung des Schneidprozesses wird aufgezeigt und diskutiert. Ergänzt wird 
das Kapitel durch eine Schilderung der Vorgehensweise in der Praxis. 


2.1 Grundlagen des Laserschneidens 


Das Wort Laser bedeutet Light Amplification by Stimulated Emission of Ra- 
diation (dt. Lichtverstärkung durch stimulierte Emission von Strahlung). 
Sowohl der physikalische Effekt als auch das Gerät, mit dem Laserstrah- 
lung generiert wird, werden als Laser bezeichnet. 

Grundsätzlich besteht jeder Laser aus einem aktiven Lasermedium, ei- 
nem Pumpmechanismus und einem Laserresonator. Als Medium kann 
beispielsweise ein Gas oder ein Kristall verwendet werden. Voraussetzung 
ist ein Material mit mindestens drei atomaren oder molekularen Energieni- 
veaus, damit durch Pumpen mit Energie die sogenannte Besetzungsinver- 
sion hergestellt werden kann. In diesem Fall ist der höhere Zustand des 
optischen Übergangs (Laserniveau) mit einer größeren Wahrscheinlichkeit 
besetzt als der darunter liegende Grundzustand. Das dritte Energieniveau 
befindet sich energetisch über den beiden anderen und entleert sich strah- 
lungsfrei auf das Laserniveau. Die Energiedifferenz zwischen Laserniveau 
und Grundzustand bestimmt die Wellenlänge der entstehenden Strahlung. 
Das Pumpen kann optisch (z. B. mit einer Lampe) oder elektrisch (z.B. 
über Gasentladung) erfolgen. Das Lasermedium befindet sich innerhalb 
eines Laserresonators, welcher mit optischen Elementen für eine reso- 
nante Rückkopplung für bestimmte Wellenlängen und Richtungen sorgt. 
Die Strahlung, die anfänglich durch spontane Emission entsteht, wird 
so immer wieder durch das Lasermedium geleitet und löst stimulierte 
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Emission aus. Ein Teil der Strahlung wird auf einer Seite des Resonators 
ausgekoppelt. Das ist der eigentliche Laserstrahl. [Sve+12] 

Laserstrahlen sind elektromagnetische Wellen, die sich durch die Kombi- 
nation der folgenden Eigenschaften auszeichnen: quasi monochromatisch, 
große Kohärenzlänge, geringe Divergenz und große Leistungsdichte. La- 
serstrahlung kann in verschiedenen Bereichen des elektromagnetischen 
Frequenzspektrums und mit ganz unterschiedlichen Leistungen erzeugt 
werden. Seit der Konstruktion eines ersten Prototyps 1960 durch Maiman 
[Mai60] werden Laser in den verschiedensten Bereichen eingesetzt. 


2.1.1 Laser in der Materialbearbeitung 


Im industriellen Umfeld spielen Laser als Werkzeug eine große Rolle. Es 
werden verschiedene Lasertypen eingesetzt, die nach der Art des jewei- 
ligen aktiven Mediums benannt sind. Beispiele sind Gas-, Festkörper-, 
Dioden-, Faser-, Excimer- und Farbstofflaser. Zu den vielfältigen Einsatz- 
möglichkeiten zählen Schneiden, Bohren, Schweißen, Oberflächenbehand- 
lung, Prototypenbau, abtragende Verfahren und Reinigung [SM10]. 

Laserschneiden ist die häufigste industrielle Anwendung des Lasers 
[Kin+18] und hat bestehende Technologien in vielen Bereichen ersetzt. 
Der Hauptgrund dafür ist, dass beim Trennen mit einem Laser in vie- 
len Fällen eine höhere Produktivität und Qualität erreicht werden kann 
als mit alternativen Methoden. Powell und Wykes [PW89] vergleichen 
den Laser als Schneidwerkzeug ausführlich mit herkömmlichen Trenn- 
verfahren. Die wichtigsten Vorteile des Laserschneidens sind die große 
Flexibilität hinsichtlich Formen und Materialien, der schmale Schnittspalt, 
rechtwinklige Ecken und vergleichsweise saubere Kanten mit einer kleinen 
Wärmeeinflusszone. Des Weiteren sind mit Lasern hohe Bearbeitungsge- 
schwindigkeiten möglich und aufgrund des kraftfreien Schneidens ist 
keine Klemmung des Werkstücks erforderlich. Die folgenden Ausführun- 
gen beziehen sich auf das Laserschneiden metallischer Werkstoffe. 


2.1.2 Laserschneidprozess 


In Abbildung 2.1 ist das Grundprinzip des Laserschneidens veranschau- 
licht. Mehrere Optiken fokussieren den Laserstrahl im sogenannten 
Schneidkopf der Laserschneidmaschine. Der Strahl tritt dann zusammen 
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Abbildung 2.1 Prinzip des Laserschneidens, Abbildung nach Hügel und Graf [HG09]. 


mit einem (üblicherweise) koaxialen Gasstrom aus der Düse des Schneid- 
kopfs aus. Der Strahl trifft auf eine geneigte Schnittfront, an der er das 
Material (von oben nach unten) schmilzt und teilweise verdampft. Das 
geschmolzene Material wird, unterstützt durch die Strömung des Schneid- 
gases, entfernt. Aufgrund der Relativbewegung zwischen Laserstrahl und 
Werkstück entsteht ein Schnittspalt. Die so entstandenen Schnittkanten 
weisen eine Riefenstruktur auf der Schnittfläche sowie gegebenenfalls 
Gratperlen an der Unterseite auf. 

1967 wurde erstmals gezeigt, dass ein CO,-Gaslaser Metall schneiden 
kann [SH67]. Anschließend wurde die Technologie jahrzehntelang einge- 
setzt. Mittlerweile werden die Gaslaser aber vermehrt durch Festkörper- 
oder Faserlaser ersetzt. Diese haben eine kürzere Wellenlänge, lassen sich 
besser fokussieren und weisen einen höheren Absorptionsgrad in metalli- 
schen Werkstoffen auf, was eine erhöhte Schneidgeschwindigkeit und das 
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Trennen von Buntmetallblechen ermöglicht [HG09; Ols11]. Ein weiterer 
Vorteil gegenüber CO,-Lasern ist, dass die Laserstrahlung von Festkörper- 
und Faserlasern mit einem Lichtleitkabel transportiert werden kann. Der 
große Nachteil ist die verringerte Qualität der Schnittkante [Ols11]. In die- 
ser Arbeit wurde ein Scheiben-Festkörperlaser eingesetzt (TruDisk 12001). 
Dessen aktives Medium ist ein Ytterbium dotierter Yttrium-Aluminium- 
Granat-Kristall. Dieser erzeugt Laserstrahlung mit einer Wellenlänge von 
1030 nm. Technische Details zum TruDisk 12001 sind in Anhang A.1 zu 
finden. 

Unterschieden werden Schmelzschneiden und Brennschneiden. Beim 
Schmelzschneiden wird das geschmolzene Material mit einem Inertgas 
(z.B. Stickstoff oder Argon) aus dem Schnittspalt ausgetrieben. Beim 
Brennschneiden wird Sauerstoff als Schneidgas eingesetzt, was eine exo- 
therme Reaktion mit dem geschmolzenen Material auslöst und zusätzliche 
Energie freisetzt. Dies wird beispielsweise genutzt, um sehr dicke Bleche 
zu schneiden. Nachteilig ist die dabei auf der Schnittkante entstehende 
Oxidschicht. Beim Schneiden von Edelstahl wird deshalb gewöhnlich 
Stickstoff verwendet. [SM10] 

Laserschneiden wird seit Jahrzehnten erfolgreich industriell eingesetzt. 
Die involvierten physikalischen Vorgänge sind jedoch, aufgrund ihrer 
großen Komplexität und der Tatsache, dass es schwierig ist, den Pro- 
zess direkt zu beobachten, bis heute nicht vollständig verstanden [HG09; 
PSW12]. 


2.1.2.1 Energiebilanz 


Bevor das Schneiden beginnen kann, muss das Werksttick erhitzt und 
geschmolzen oder verdampft werden, bis sich ein Loch (engl. keyhole) 
bildet. Dieser Prozess wird als Einstechen bezeichnet. Damit beginnt das 
eigentliche Schneiden, die Formierung des Schnittspalts und das Aus- 
treiben der Schmelze. Die folgenden Prozesse spielen dabei eine zentrale 
Rolle: Energiebilanz, Schmelzfilm, Gasströmung und Materialaustrieb. Als 
wichtigste Einflussfaktoren auf diese Prozesse nennen Hügel und Graf 
[HG09] die Eigenschaften des Laserstrahls sowie die Fokussierung, die 
Eigenschaften von Gas und Schneiddüse und die Eigenschaften des Werk- 
stoffs. Da es in dieser Arbeit um eine datenbasierte Annäherung an den 
Laserschneidprozess geht und nicht um den Versuch, den bestehenden 
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Modellen ein weiteres physikalisch motiviertes hinzuzufügen, soll hier — 
um ein Grundverständnis zu schaffen - nur kurz auf die Energiebilanz ein- 
gegangen werden. Für detailliertere Informationen zu allen Teilprozessen 
und Einflussgrößen sei auf die Literatur verwiesen [HG09; SM10; Yil17]. 


Globale Energiebilanz Die Energieeinkopplung, also die Umwandlung 
von Laserenergie in Prozesswärme, spielt beim Laserschneiden eine zen- 
trale Rolle. Anhand der globalen Energiebilanz 


P, + Pop, = Py = vsdp(cör + hg) (2.1) 


lässt sich abschätzen, welche Blechdicke mit welcher Geschwindigkeit 
getrennt werden kann [HG09]. Auf der linken Seite der Gleichung steht 
die verfügbare Prozessleistung. Diese setzt sich zusammen aus der an 
der Schnittfront absorbierten Leistung P,, welche der Leistung des La- 
serstrahls abzüglich der an der Oberfläche des Werkstücks und an der 
Schnittfront reflektierten und der durch den Schnittspalt transmittierten 
Leistung entspricht. Welcher Anteil der einfallenden Leistung reflektiert 
oder transmittiert wird, hängt insbesondere von der Neigung der Schnitt- 
front ab. Diese nimmt mit wachsender Geschwindigkeit zu [Moh94]. Beim 
Brennschneiden mit Sauerstoff als Schneidgas wird die zur Verfügung 
stehende Leistung durch die chemische Verbrennungsleistung P.n» vergrö- 
fert. Reduziert wird sie durch Verluste Py, aufgrund in das Werkstück 
fließender Wärme, thermischer Strahlung und konvektiver Wärmeabfuhr. 

Auf der rechten Seite der Gleichung wird das pro Zeit aufschmelzbare 
Volumen (als Produkt der Schneidgeschwindigkeit v, der Schnittspaltbreite 
s und der Blechdicke d) multipliziert mit dem spezifischen Energiebedarf. 
Dieser setzt sich zusammen aus Dichte des Werkstücks p, der spezifischen 
Wärmekapazität des Materials c, der für das Schmelzen erforderlichen 
Temperaturdifferenz ôy und der spezifischen Schmelzenthalpie hs. Diese 
gibt an, wie viel Energie pro Masse für den Übergang vom festen zum flüs- 
sigen Aggregatzustand nötig ist. Je kleiner der spezifische Energiebedarf 
des Werkstoffs ist, desto größer ist das pro Zeit aufschmelzbare Volumen. 
Neben dem Aufschmelzen des Materials durch Einkopplung einer ausrei- 
chend großen Leistung sollte für einen kontinuierlichen Trennvorgang ein 
quasi-stationärer Zustand zwischen geschmolzenem und ausgetriebenem 
Material vorliegen. 
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2.1.3 Laserschneidmaschine 


Abbildung 2.2 zeigt eine moderne 2D-Laserschneidmaschine. Als Strahl- 
quelle dient bei dieser Maschine ein Festkörper-Scheibenlaser. Über das 
Lichtleitkabel wird die Strahlung vom Laser zum Schneidkopf innerhalb 
der Maschine transportiert. Dieser ist in Abbildung 2.3 zu sehen. Am 
oberen Ende des Schneidkopfs wird die Strahlung aus dem Lichtleitkabel 
ausgekoppelt. Dann wird sie mithilfe mehrerer beweglicher Optiken fo- 
kussiert, die Fokusposition und der Fokusdurchmesser werden eingestellt. 
Am unteren Ende transmittiert der Laserstrahl durch das Schutzglas, das 
die Optiken vor Verschmutzungen schützt, und verlässt den Schneidkopf 
durch die Düse. Die Maschine ist mit einer sogenannten fliegenden Optik 
ausgestattet. Das bedeutet, dass sich der Schneidkopf bewegt und das 
Blech in Ruhe auf den Stegen der Palette liegt. 

Um die Maschine zu beladen, wird das Blech außerhalb auf die Palette 
gelegt. Danach wird es mit dem Palettenwechsler ins Innere der Maschine 
gefahren und die Bearbeitung kann beginnen. Kleine geschnittene Teile fal- 
len zwischen den Stegen hindurch auf ein Förderband, mit dem sie aus der 
Maschine transportiert werden. Große Teile bleiben auf der Palette liegen 
und können nach dem Schneiden außerhalb der Maschine automatisiert 
oder manuell aus dem Restgitter entnommen werden. Die Stege der Ma- 
schine, auf deren Spitzen das Blech aufliegt verlaufen in y-Richtung und 
haben einen Abstand von 67 mm in x-Richtung und eine Breite von 3 mm. 
Die Stege sind keine durchgängigen Bleche, sondern haben - ähnlich wie 
ein Rechen - einzelne Spitzen, auf denen das Blech aufliegt. 

Die Maschine ist wegen der gefährlichen Laserstrahlung (Laserklasse 4 
[Deu15]) und den gesundheitsschädlichen Stäuben und Dämpfen komplett 
eingehaust und mit einer Absaugung, die zu einem Entstauber führt, 
versehen. 
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Entstauber Palettenwechsler 


Kühler 
Lichtleitkabel 


Bewegungseinheit 


Laser 
Schutzkabine mit Türe 


und Bedienpanel 


Abbildung 2.2 Moderne 2D-Flachbett-Laserschneidmaschine mit Festkörperlaser und flie- 
gender Optik. Bei einem Arbeitsbereich von 3m in x-Richtung und 1,5 m in y-Richtung hat 
die Maschine eine Aufstellflache von 8,8m x 4,8m. Quelle: TRUMPF. 


Auskoppeln 
Lichtleitkabel PP 


Bewegliche 
Optiken 


Schutzglas 


Diise 


Abbildung 2.3 Schneidkopf der in Abbildung 2.2 gezeigten Laserschneidmaschine. Quelle: 
TRUMPF. 
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2.2 Qualität thermischer Schnitte 


Das Prozessergebnis wird neben der erreichten Produktivität durch die 
Qualität des geschnittenen Teils definiert. 


2.2.1 Schnittkantenqualität nach Norm 


Hügel und Graf [HG09] nennen die folgenden Qualitätsaspekte beim 
Laserschneiden: Maßhaltigkeit, Schnittspaltbreite, Form der Schnittflanke, 
Rauigkeit, Bartbildung, Wärmeeinflusszone und Oxidfreiheit. Sie stellen 
fest, dass die Bearbeitungsqualität „keine absolut und für sich allein zu 
bewertende Größe” ist, sondern von verschiedenen Randbedingungen, 
z.B. nachfolgenden Fertigungsprozessen, abhängt. 

Die Norm DIN EN ISO 9013 [Deu17] definiert die Qualität eines thermi- 
schen Schnittes auf Basis der Form- bzw. Lagetoleranzen und des Ausse- 
hens der Schnittkante. Sie ist gültig für Laserstrahlschnitte in Materialien 
mit Dicken zwischen 0,5 und 32mm. Da in dieser Arbeit nicht ganze ge- 
schnittene Teile, sondern nur gerade Schnittkanten betrachtet werden, 
können die Form- bzw. Lagetoleranzen nicht zur Bewertung hinzugezo- 
gen werden. Stattdessen wird die Prozessqualität anhand der Schnittkante 
beurteilt. 

Die Qualität der Schnittfläche wird durch die beiden obligatorischen 
Größen Rechtwinkligkeits- oder Neigungstoleranz u und gemittelte Rau- 
tiefe Rz5 beschrieben. Bei ersterer handelt es sich um den Abstand zweier 
paralleler Geraden, die (bei Senkrechtschnitten) orthogonal zur Oberseite 
des Werkstücks verlaufen und zwischen denen das Schnittflächenprofil 
liegt. Dies ist in Abbildung 2.4(a) veranschaulicht. Die Messung von u 
wird in einem eingeschränkten Bereich der Schnittfläche durchgeführt, 
damit das Ergebnis nicht durch die Anschmelzung der Oberkante oder 
Gratbildung an der Unterkante beeinflusst wird. Im Falle eines 3mm di- 
cken Werkstücks muss der zu vermessende Bereich beispielsweise oben 
und unten jeweils um 0,3 mm verringert werden. Die gemittelte Rautiefe 
Rz5 ist das arithmetische Mittel der Differenzen zwischen der höchsten 
Spitze und der tiefsten Senke in fünf benachbarten Einzelmessstrecken 
eines Rauheitsprofils (siehe Abbildung 2.4(b)). Details zum Messgerät und 
zur Messung der Rautiefe sind in DIN EN ISO 3274 [Deu98a] beziehungs- 
weise DIN EN ISO 4288 [Deu98b] aufgeführt und im folgenden Abschnitt 
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Tabelle 2.1 Qualitätsklassen für die Rechtwinkligkeitstoleranz u und Rautiefe Rz5 nach 
DIN EN ISO 9013 [Deu17] in Abhängigkeit von der Blechdicke d (in mm). 


Klasse u maximal in pm Rz5 maximal in um 
1 50 + (3 - d/mm) 10 + (0,6 - d/mm) 
2 150 + (7: d/mm) 40 + (0,8: d/mm) 

3 400 + (10 -d/mm) 70+ (1,2: d/mm) 
4 800 + (20:d/mm) 110+ (1,8: d/mm) 
5 1200 + (35: d/mm) - 


2.2.1.1 kurz zusammengefasst. Rechtwinkligkeitstoleranz und Rautiefe 
müssen dort gemessen werden, wo die größten Werte zu erwarten sind, 
wobei es sich um zwei verschiedene Stellen handeln kann. Einzelne Feh- 
ler, wie z.B. sogenannte Kolkungen, müssen nicht einbezogen werden. 
Die Qualitätsklassen für Rechtwinkligkeitstoleranz und Rautiefe sind in 
Abhängigkeit von der Dicke des Werkstoffs d in Tabelle 2.1 gezeigt. Die 
Praxis hat gezeigt, dass beim Laserschneiden von rostfreiem Strahl einer 
Dicke von 3mm mit einem Festkörperlaser die u-Qualitätsklasse 1 und 
die Rz5-Qualitätsklasse 2 erreicht werden kann. Zusätzlich zu u und Rz5 
können der Rillennachlauf, der projizierte Abstand zweier Schnittrillen 
in Schneidrichtung (siehe Abbildung 2.4(c)), und der Radius der Schnitt- 
oberkante (siehe Abbildung 2.4(d)) sowie der Grat an der Unterseite des 
Werkstücks zur Bewertung der Schnittkante hinzugezogen werden. Wie 
genau der Grat quantifiziert werden soll, ist nicht festgelegt. 


2.2.1.1 Details zur Rautiefenmessung 


Die Ermittlung der Rautiefe basiert auf dem Rauheitsprofil der Schnitt- 
fläche. Dazu muss diese mit einem Tastschnittverfahren zweidimensio- 
nal erfasst werden. Das tatsächlich gemessene Oberflächenprofil wird 
als ungefiltertes Primärprofil bezeichnet. Durch dessen Filterung mit ei- 
nem Lang- bzw. Kurzpass-Gauß-Filter entstehen das relativ langwellige 
Welligkeitsprofil und das relativ kurzwellige Rauheitsprofil. Die drei un- 
terschiedlichen Profile sind in Abbildung 2.5 gezeigt. 

Der Übergang zwischen Welligkeits- und Rauheitsprofil wird durch die 
sogenannte Grenzwellenlänge definiert. Deren Wahl wiederum hängt von 
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u Messstrecke 
(a) Rechtwinkligkeitstoleranz u. (b) Gemittelte Rautiefe Rz5 = t yp R2;: 
vu 
(c) Rillennachlauf. (d) Anschmelzung der Oberkante. 


Abbildung 2.4 Qualitätskenngrößen für eine thermische Schnittflache nach DIN EN ISO 
9013 [Deu17]. Die Schnittkante ist hier aus verschiedenen Perspektiven zu sehen. In den 
Abbildungen (b) und (c) blickt man frontal auf die Schnittkante (so wie bei den in dieser 
Arbeit gezeigten RGB-Aufnahmen). Bei den Abbildungen (a) und (d) ist die Blickrichtung 
dagegen parallel zu Schneidrichtung und Schnittfläche. 
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— Primärprofil 
— Rauheitsprofil 
Welligkeitsprofil 


; 


Höhe in um 


0,0 2,5 5,0 7,5 10,0 12,5 
Messstrecke in mm 


Abbildung 2.5 Mittels Filterung werden das Rauheits- bzw. das Welligkeitsprofil aus dem 
gemessenen Primärprofil extrahiert. Die Grenzwellenlänge für das Kurz- bzw. das Langpass- 
filter beträgt hier 2,5 mm; die ausgewertete Messstrecke ist 12,5 mm lang. 


der erwarteten Rautiefe ab. Dies ist in Tabelle 2.2 erklärt. Beispielsweise 
gilt bei einer erwarteten Rautiefe von 40 um eine Grenzwellenlänge von 
2,5mm. Mit der Wahl der Grenzwellenlange ist automatisch auch die 
Lange der Gesamtmessstrecke festgelegt. Ergibt sich nach Filterung des 
Primärprofils und Ermittlung der Rautiefe aus dem Rauheitsprofil ein 
Wert kleiner als 10 oder größer als 50 um, müssen die Messdaten nochmals 
mit einer kleineren bzw. größeren Grenzwellenlänge ausgewertet werden. 


2.2.2 Nachbearbeitung 


Laserschneiden findet stets innerhalb einer Prozesskette statt. Vorgela- 
gerte Prozesse sind beispielsweise die Erstellung eines Angebots oder 
die Generierung eines ausführbaren Programms für die Maschinensteue- 
rung. Nachgelagerte Prozesse sind - je nach Produkt - Biegen, Zerspanen, 
Schweißen, Markieren, Stanzen, Beschichten, Verzinken, Lackieren und 
die Montage. Jeder dieser nachgelagerten Prozesse stellt bestimmte Anfor- 
derungen an die Qualität des geschnittenen Teils. Im Idealfall sollte eine 
Schnittkante keinen Grat sowie keine Spritzer- oder Schmelzperlen an der 
Ober- und Unterseite aufweisen. Sie sollte oxidfrei, möglichst rechtwinklig 
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Tabelle 2.2 Messung der Rautiefe nach DIN EN ISO 3274 [Deu98a] und DIN EN ISO 4288 
[Deu98b]. Je nach erwarteter Rautiefe müssen die Grenzwellenlänge des Kurzpassfilters (zur 
Unterdrückung der Welligkeit) und die zugehörige Messstrecke angepasst werden. 


Rz5 Grenzwellenlange Messstrecke 
in pm in mm inmm 
unter0,1 0,08 0,4 
0,1bis0,5 0,25 1,25 
0,5bis10 0,80 4,0 

10bis50 2,50 12,5 

50 bis 200 8,00 40 


und glatt sein [Sti19]. Oft sind scharfe Kanten nicht gewünscht, da sie die 
Verletzungsgefahr erhöhen und Probleme beim Beschichten verursachen. 
In vielen Produktionsanlagen stehen Maschinen oder Handwerkzeuge zur 
nachträglichen Verbesserung der Schnittkante bereit. Dies geschieht durch 
Entgraten oder Schleifen. Moderne Entgratmaschinen korrigieren stören- 
de Eigenschaften in mehreren Schritten mechanisch. Dazu verwenden sie 
verschiedene Schleifbänder, -bürsten und -walzen. Da jeder Nachbear- 
beitungsschritt die nötige Zeit und die Kosten pro Teil erhöht, sollte die 
Schnittqualität idealerweise so gut sein, dass keine Nachbearbeitung der 
Kanten und Teile nötig ist. 


2.3 Modellierung des Laserschneidprozesses 


Im Folgenden wird der Stand der Wissenschaft der Modellierung des 
Laserschneidprozesses erläutert. Dabei wird unterschieden zwischen phy- 
sikalisch motivierten Ansätzen und datenbasierten Methoden des ma- 
schinellen Lernens. Bei der datenbasierten Modellierung versucht man, 
Zusammenhänge zwischen den Ein- und Ausgangsgrößen eines Systems 
ohne die Kenntnis des physikalischen Verhaltens abzubilden. Ein Modell 
wird dazu auf einem repräsentativen Datensatz, der möglichst alle Aspek- 
te des abzubildenden Verhaltens enthält, trainiert. Anschließend wird das 
Modell zu Validierungszwecken auf Daten angewendet, die nicht zum 
Training verwendet wurden. Zu den datenbasierten Methoden zählen z. B. 
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neuronale Netze, evolutionäre Algorithmen und Fuzzy-Regel-basierte 
Systeme [SSA08]. Die Grundlagen des maschinellen Lernens und die in 
dieser Arbeit verwendeten Modellansätze sind in den Kapiteln 3 bzw. 5 
nachzulesen. 


2.3.1 Physikalisch motivierte Modellierung 


Beim Laserschneiden sind mehrere physikalische Teilprozesse involviert. 
In analytischen Modellen wird meist nur ein Teilprozess betrachtet und 
das thermische Verhalten modelliert. Ein Modell wurde mit Gleichung 
(2.1) bereits vorgestellt. Publiziert wurden unter anderem stationäre ther- 
mische Modelle [CM87; Yil17] und solche, die die Bewegung des Laser- 
strahls einbeziehen [CA77; Ros46]. Außerdem wurden die analytischen 
Zusammenhänge zwischen verschiedenen Prozessparametern (z.B. La- 
serleistung) und der maximal trennbaren Blechdicke hergeleitet [KRL97]. 
Ivarson et al. [I[va+94] haben die Entstehung der Riefen auf der Schnittkan- 
te beim Brennschneiden in Abhängigkeit des Sauerstoffpartialdrucks, der 
Viskosität und der Oberflächenspannung der Schmelze betrachtet. Yilbas 
und Aleem [YA06] untersuchten den Schmelzfilm und die Entstehung 
von Gratperlen bei verschiedenen Laserleistungen und Gasdrücken beim 
Brennschneiden. Auch wenn es die analytischen Modelle ermöglichen, ein 
tieferes Verständnis eines einzelnen Teilprozesses unter ganz bestimmten 
Bedingungen zu erlangen, sind diese Modelle nicht in der Lage, den realen 
Gesamtprozess abzubilden. 

Steen und Mazumder [SM10], Yilbas [Yil17] und Otto et al. [Ott+11] 
geben einen Überblick über numerische Modellierungsansätze. Da viele 
davon Jahrzehnte alt sind, wird hier nur exemplarisch auf einige aktuellere 
Arbeiten eingegangen. 

Otto et al. [Ott+11] präsentieren einen numerischen Ansatz zur dyna- 
mischen Modellierung verschiedener Lasermaterialbearbeitungsprozesse. 
Abgebildet werden die Propagation des Laserstrahls zum Werkstück, die 
Interaktion des Strahls mit dem Material, Wärmeleitung und Konvekti- 
on sowie der Schmelzfluss. Durch die Simulation können die Schmelz- 
und Dampfströmung in Abhängigkeit von der Zeit visualisiert werden. 
Es werden nicht alle physikalischen Wechselwirkungen berücksichtigt, 
beispielsweise fehlt die Kopplung von Strömungs- und Thermodynamik. 
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Das Fraunhofer-Institut für Lasertechnik (ILT) in Aachen hat die Simu- 
lationssoftware QuCUT entwickelt. Bei dem zugrunde liegenden Modell 
handelt es sich um einen hybriden numerischen Ansatz. Mit QuCUT lässt 
sich der Zusammenhang zwischen fünf Designparametern einer Laser- 
optik (Strahlqualität, Astigmatismus, Fokusposition und Strahlradius in x- 
und y-Richtung) und der Riefenstruktur einer Schnittkante modellieren. 
Weitere Prozessparameter können nicht berücksichtigt werden. [PSS10] 

Die Simulationssoftware CALCut [Pet16] vereint die Vorteile der analyti- 
schen und numerischen Ansätze zu einem dreidimensionalen stationären 
Modell. Es handelt sich dabei um eine Kombination verschiedener Algo- 
rithmen, mit der sich alle relevanten physikalischen Teilprozesse abbilden 
lassen. Als Eingangsgrößen dienen die Materialart und -dicke, Eigenschaf- 
ten des Laserstrahls, Gasart und -druck sowie die Schneidgeschwindigkeit. 
Unter Berücksichtigung der räumlichen Verteilung der absorbierten Leis- 
tung, der Temperatur, der Dicke und Fließgeschwindigkeit des Schmelz- 
films, der Verdampfungsrate und der Druckgradienten werden die Geo- 
metrien von Schnittfront und Schnittspalt, sowie die maximal mögliche 
Schneidgeschwindigkeit berechnet. CALCut ist sehr nützlich für die Er- 
weiterung des Prozessverständnisses. Für die Unterstützung in der Praxis 
ist die Software jedoch nur bedingt geeignet, da über die Geometrien der 
Schnittfront und des Schnittspalts zwar Rückschlüsse auf die Qualität 
möglich sind, aber der Zusammenhang zwischen Eingangsgrößen und 
Qualitätskriterien der Schnittkante nicht direkt abgebildet wird. 

2011 schrieben Otto et al. [Ott+11], dass Simulationen des Laserschneid- 
prozesses in der industriellen Produktion nicht Stand der Technik sind. 
Daran hat sich bis heute wenig geändert. Trotz vieler Bemühungen in der 
Vergangenheit ist es bislang nicht gelungen, ein Modell zu entwickeln, das 
schnelle Antworten auf praxisrelevante Fragestellungen liefert. Als Haupt- 
grund dafür identifizieren Otto et al. [Ott+11] die enorme Komplexität des 
Prozesses durch die Wechselwirkung verschiedenster physikalischer Ef- 
fekte (mehr dazu in Abschnitt 2.1). In den meisten Fällen werden deshalb 
stark vereinfachende Annahmen getroffen, die wiederum dazu führen, 
dass nur einzelne Phänomene beschrieben werden können. Datenbasier- 
te Methoden könnten diese Problematik lösen, aufgrund ihrer Fähigkeit 
komplexe Zusammenhänge abzubilden. Sie sind dabei nicht als Ersatz, 
sondern eher als Ergänzung zu bestehenden Modellen zu sehen. 
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2.3.2 Datenbasierte Modellierung 


Obwohl komplexe ML-Modelle, wie z. B. tiefe neuronale Netze, bereits er- 
folgreich in einigen Bereichen der fertigenden Industrie eingesetzt werden 
(siehe Abschnitt 3.2.5), finden sie beim Laserschneiden bislang nur wenig 
Anwendung. 

Einfache ML-Modelle wurden beispielsweise von Tercan et al. [Ter+16] 
eingesetzt. Sie verwendeten Klassifikations- und Regressionsbäume, um 
den Zusammenhang zwischen den Prozessparametern Strahlqualität, As- 
tigmatismus, Fokusposition und Strahlradius und dem Fehlschnittrisi- 
ko beziehungsweise der Rauheit der Schnittkante zu modellieren. Für 
das Training der Modelle wurden mit QuCUT [PSS10] generierte Simu- 
lationsdaten verwendet. Mithilfe dieser Modelle lassen sich Parameter- 
fenster guter Qualität identifizieren und Zusammenhänge interpretieren 
[Ter+16]. Nachfolgearbeiten [Ter+17] verwendeten dieselbe Datengrundla- 
ge. Schnittkanten wurden anhand ihrer Rauheit mittels k-means Clustering 
in fünf verschiedene Qualitätsgruppen aufgeteilt. Die Gruppe mit den 
kleinsten Rauheitswerten wurde als gut definiert, die anderen als schlecht. 
Anschließend wurden wieder Klassifikationsbäume eingesetzt, um die Ab- 
hängigkeiten zwischen den Prozessparametern und guter bzw. schlechter 
Qualität zu modellieren. 

Madié und Radovanović [MR12b] betrachteten ebenfalls den Zusam- 
menhang zwischen verschiedenen Prozessparametern und einigen Quali- 
tätskriterien. Sie übergaben die Prozessparameter Schneidgeschwindig- 
keit, Laserleistung, Gasdruck und Fokusposition an ein neuronales Netz, 
welches die Größe der Wärmeeinflusszone vorhersagte. Ihre experimen- 
tell erzeugte Datenbasis bestand aus 27 Schnitten in einem 3mm dicken 
Edelstahlblech. Das verwendete neuronale Netz hatte vier Eingangs-, vier 
verdeckte und ein Ausgangsneuron. (Mehr zu diesen Begriffen steht in 
Abschnitt 3.2.1). Madié und Radovanović [MR12c] modellierten außerdem 
den Einfluss derselben Prozessparameter (ohne die Fokusposition) auf die 
Rauheit der Schnittkante anhand eines neuronalen Netzes. Die Datenbasis 
beinhaltete 25 Schnitte in 2mm dickem Baustahl. Das trainierte neuronale 
Netz hatte drei Eingangs-, fünf verdeckte und ein Ausgangsneuron. 

Tsai et al. [TLC08] haben ähnliche Untersuchungen für das Laserschnei- 
den von Chipgehäusen angestellt. Sie modellierten den Zusammenhang 
zwischen drei Prozessparametern eines mit Dioden gepumpten Lasers 
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(Strom, Frequenz, Schneidgeschwindigkeit) und sechs Qualitätskenngrö- 
ßen, z.B. der Breite der Wärmeeinflusszone, mit einem neuronalen Netz. 
Dieses wies eine verdeckte Schicht aus drei Neuronen auf. Die Datenbasis 
enthielt 27 Trainings- und 14 Testbeispiele. Um anschließend die optimalen 
Parameter hinsichtlich der Wärmeeinflusszone und der Geschwindigkeit 
zu finden, verwendeten sie einen genetischen Algorithmus. Das neuronale 
Netz diente dabei zur Berechnung der Fitnessfunktion. 

Anstatt eines genetischen Algorithmus zur Optimierung der Prozess- 
parameter für das Laserschneiden einer Aluminiumlegierung verwen- 
deten Chaki et al. [CBB20] eine Partikelschwarmoptimierung basierend 
auf einem neuronalen Netz mit sieben verdeckten Neuronen. Das Netz 
schätzte vier Qualitätskenngrößen (z. B. Schnittspaltbreite) in Abhängig- 
keit von drei Prozessparametern (Schneidgeschwindigkeit, Pulsenergie 
und -breite). Die Datenbasis bestand aus 27 Schnitten mit verschiedenen 
Kombinationen der Prozessparameter. 

Zusammenfassend ist zu sagen, dass es sich in allen genannten Fällen 
um sehr einfache Modellansätze handelt, die auf sehr kleinen Datenmen- 
gen (oder auf Simulationsdaten) entwickelt wurden. Wegen der jeweils 
verschiedenen Datengrundlagen und den wenigen Testdaten sind die Er- 
gebnisse, insbesondere Angaben zur Modellgüte, nicht auf die vorliegende 
Arbeit übertragbar. 


2.4 Laserschneiden in der Praxis 


Diese Doktorarbeit wurde im Rahmen einer Industriepromotion bei der 
Firma TRUMPF Werkzeugmaschinen GmbH + Co. KG (im Folgenden 
TRUMPF genannt) angefertigt. Das Unternehmens-Portfolio umfasst Werk- 
zeugmaschinen zum Biegen, Stanzen und für Laserschneid- und Laser- 
schweißanwendungen. TRUMPF ist Weltmarktführer für (elektronische) 
Werkzeugmaschinen und industrielle Laser [Mül20; Sim07]. Da es keine 
Fachliteratur zum Laserschneiden in der Praxis gibt, kann hier nur die 
Sichtweise bei und im Umfeld von TRUMPF wiedergegeben werden. Die 
Kunden von TRUMPF sind überwiegend kleine bis mittelständische Un- 
ternehmen, die als Auftragsfertiger (engl. job shopper) arbeiten [Lei08]. Da 
sie keine eigenen Produkte anbieten, sondern Blechteile für andere Firmen 
fertigen, ändern sich Aufträge und Anforderungen häufig. 
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2.4.1 Beurteilung der Qualität 


Bei TRUMPF sind Messgeräte zur Bestimmung der Rautiefe, Rechtwink- 
ligkeitstoleranz und Grathöhe vorhanden. Wie in Abschnitt 1.1.1 bereits 
beschrieben, ist dies in kleinen Unternehmen meist nicht gegeben. Die 
Beurteilung der Qualität erfolgt deshalb subjektiv durch Einzelpersonen. 
Dabei wird ggf. zusätzlich einbezogen, welche Nachbearbeitungsprozesse 
verfügbar sind und wie das geschnittene Teil weiterverwendet werden 
soll. 


2.4.2 Überprüfung des Maschinenzustands 


Ein stabiler, klar definierter Zustand der Laserschneidmaschine ist die 
Grundvoraussetzung für die Kontrollierbarkeit des Prozesses, da nur 
in diesem Fall davon ausgegangen werden kann, dass die eingestellten 
Soll-Prozessparameter ausreichend gut mit den Ist-Prozessparametern 
übereinstimmen und Laserschneiden bis heute ein gesteuerter und kein 
geregelter Prozess ist. Eine Überprüfung des Maschinenzustands wird 
entweder regelmäßig, z.B. zu Schichtbeginn, oder beim Auftreten von 
Schneidproblemen durchgeführt. 

Da eine automatische Überprüfung des Gesamtsystems nicht möglich ist 
und weil Menschen nicht in der Lage sind, vom Fehlerbild der Schnittkante 
auf die Ursache zu schließen (siehe Abschnitt 6.2.1.2), müssen verschie- 
dene Einzelkomponenten nacheinander überprüft werden. Dazu zählen 
beispielsweise die Düse (Sauberkeit, keine Kratzer oder Dellen), die Strahl- 
position (der Laserstrahl sollte genau im Düsenmittelpunkt austreten) und 
das Schutzglas (Sauberkeit). Unterstützt wird der Bediener oder die Bedie- 
nerin dabei von Anleitungen im Benutzerhandbuch der Maschine oder in 
einer App sowie von Sensorik. 

Die Probleme lassen sich am Beispiel des Schutzglases verständlich ma- 
chen. Dieses befindet sich zwischen den optischen Elementen im Schneid- 
kopf und der Düse, durch die der Strahl zusammen mit dem koaxialen 
Gasstrom austritt. Wie der Name schon sagt, dient das Schutzglas dem 
Schutz der Optiken vor Spritzern und Dämpfen. Ein verschmutztes Schutz- 
glas hat einen verringerten Transmissionsgrad. Dies führt zum einen dazu, 
dass weniger Laserleistung zum Schneiden zur Verfügung steht und zum 
anderen dazu, dass sich das Schutzglas und der gesamte Schneidkopf 
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stärker erwärmen als üblich. Dadurch kann es zu einer thermisch induzier- 
ten Fokusverschiebung kommen, die sich auf die Schnittqualität auswirkt 
[TP20b]. 

Um die Sauberkeit des Schutzglases zu überprüfen, kann man es ent- 
weder ausbauen und mit bloßem Auge nach Verschmutzungen suchen, 
oder man verwendet die Schutzglas-Sensorik. Diese misst den Streulicht- 
anteil am Rand des Glases orthogonal zur Strahlachse. Je mehr Schmutz 
vorhanden ist, umso stärker ist die Streuung. Beim Einsetzen eines neuen 
Schutzglases wird die Sensorik kalibriert. Bei späteren Messungen wird 
das detektierte Streulicht mit diesem Anfangswert verglichen und eine 
Abweichung in Prozent angegeben. In beiden Fällen muss der Mensch 
entscheiden, ab wann eine Verschmutzung so gravierend ist, dass das Glas 
gereinigt oder getauscht werden muss. Es ist schwierig einzuschätzen, 
wie groß die Auswirkung einer Verschmutzung dieser Komponente auf 
den Gesamtprozess ist. Außerdem erfordert diese Vorgehensweise eine 
geschulte Fachkraft und viel Zeit. Da ein Teil des Schneidkopfs für den 
Ausbau des Schutzglases abgenommen werden muss, kann es durch die 
Überprüfung zu weiteren Veränderungen im Gesamtsystem kommen. 

Insbesondere bei voll automatisierten Maschinen, die ohne menschliche 
Eingriffe be- und entladen werden können, ist ein weiteres Problem, dass 
der Maschinenzustand nicht dauerhaft überwacht werden kann. Plötzli- 
che Veränderungen können aber jederzeit auftreten, beispielsweise durch 
Spritzer oder durch Kollisionen des Schneidkopfs mit verkippten, hoch- 
stehenden Blechteilen. Unbemerkte Probleme, die die Schnittqualität ver- 
schlechtern, verursachen Ausschuss oder erhöhen den Nachbearbeitungs- 
aufwand. 


2.4.3 Ermittlung und Optimierung der Prozessparameter 


Zusammen mit jeder Laserschneidmaschine werden Parametertabellen, 
die sogenannten LTTs (Laser-Iechnologie-Tabellen), angeboten. Diese bein- 
halten die einzustellenden Prozessparameter für verschiedene Materialien, 
Blechdicken und Bearbeitungsarten. Neben den Prozessparametern für 
unterschiedliche Schneidprozesse müssen auch passende Einstellungen 
für das Einstechen, das Beschriften usw. gefunden werden. 

Die LTTs werden manuell erstellt. Normalerweise orientiert man sich 
dabei an ähnlichen Prozessen und versucht, von diesem Startpunkt aus 
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die Parameter experimentell zu optimieren. Sollen z. B. Parameter für eine 
höhere Laserleistung gefunden werden, beginnt man mit den Parametern 
für die nächst niedrigere Leistung. Die Optimierung der Prozessparameter 
basiert auf Bandbreitenvariationen der dominantesten Prozessparameter. 
Es werden maximal zwei Prozessparameter gleichzeitig variiert und mit 
jeder Kombination wird ein Teil geschnitten. So kann man sehen, wie sich 
welche Änderung auf die Schnittqualität auswirkt. Die Qualität der Schnit- 
te wird anschließend manuell beurteilt. Dabei bezieht man gemessene 
Werte ein und vergleicht die erzielte Qualität mit Schnittkanten ähnlicher 
LTTs als Referenz. Entscheidend ist jedoch das subjektive Urteil des Ver- 
suchsexperten. Durch mehrere Bandbreitenvariationen versucht man, die 
optimale Parameterkombination iterativ zu finden. 

Bei der Auswahl der Parameter muss stets ein Kompromiss eingegangen 
werden, da verschiedene Qualitätsziele (z. B. geringe Rautiefe und mini- 
male Grathöhe) unvereinbar sein können. Gleichzeitig muss eine gewisse 
Robustheit des Prozesses sichergestellt werden. Dies realisiert man durch 
Gewährleistung einer Fokusbandbreite, was bedeutet, dass es bei Verände- 
rungen der Fokusposition um beispielsweise 1 mm in jede Richtung nicht 
zu einer Veränderung der Schnittqualität kommen darf. Ebenfalls aus Sta- 
bilitätsgründen wird eine sogenannte Vorschubreserve von der maximal 
möglichen Schneidgeschwindigkeit abgezogen und so das Risiko für einen 
Fehlschnitt (d.h. eine Unterbrechung des Schnittspalts) verringert. Neben 
der Qualität und Stabilität des Prozesses stellt die Maximierung der Pro- 
duktivität ein weiteres Optimierungskriterium dar. Bei der Ermittlung der 
LTTs muss man entscheiden, wie die drei genannten Optimierungsziele zu 
gewichten sind und Kompromisse eingehen. Durch die Vorschubreserve 
wird beispielsweise eine Verminderung der Schnittqualität und der Pro- 
duktivität in Kauf genommen, um die Prozessstabilität zu erhöhen und 
das Fehlschnittrisiko zu vermindern. Mit den neuen Parametern werden 
über mehrere Stunden und auf mehreren Maschinen verschiedene Teile 
geschnitten, um die Übertragbarkeit der Ergebnisse abzusichern. Anschlie- 
ßend werden einzelne, definierte Abnahmeteile hinsichtlich Rautiefe und 
Rechtwinkligkeitstoleranz vermessen. 

Bei der Bestimmung neuer Schneiddaten verlässt man sich auf Einzel- 
personen. Deren subjektive Einschätzung der Qualität, Gewichtung der 
Optimierungskriterien und Wissen über den Prozess sind entscheidend 
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für die resultierende LTT-Parameterkombination. Die damit verbundenen 
Nachteile wurden bereits beschrieben. 

Oft ist es so, dass es trotz der gewissenhaften Ermittlung der LTT- 
Parameter beim Anwender zu Problemen kommt. Dafür gibt es drei Ursa- 
chen: Maschinenzustand, Materialtoleranzen und individuelle Qualitäts- 
präferenzen. Treten Qualitätsprobleme auf, muss zuallererst der Maschi- 
nenzustand überprüft und gegebenenfalls korrigiert werden. Bestehen die 
Probleme weiterhin, ist dies meist dem Einfluss der Materialzusammen- 
setzung und -qualität geschuldet, weil die LTTs in einem hochwertigen 
Referenzmaterial ermittelt werden und viele Firmen deutlich günstigere 
Bleche wechselnder Herkunft verwenden. Ein weiterer Grund für Pro- 
bleme mit den LTTs ist, dass je nach Teil, späterem Einsatzzweck oder 
vorhandener Nachbearbeitung eine andere Gewichtung der Kriterien Qua- 
lität, Stabilität und Produktivität vorliegen kann. In beiden Fällen ist eine 
Anpassung der LTT-Parameter unumgänglich. Dazu sind unerfahrene 
oder schlecht ausgebildete Arbeitskräfte kaum in der Lage, was lange 
Maschinenstillstandszeiten, aufwendige Nachbearbeitung aller Teile oder 
Serviceeinsätze nach sich zieht. Da sich bei Auftragsfertigern sowohl Kun- 
den als auch Anforderungen und Materialien häufig ändern, treten diese 
Probleme wiederholt auf. 

Die Bearbeitung aller thematisierten Probleme in der Praxis würde den 
Rahmen dieser Arbeit sprengen. Der Fokus liegt auf der Bereitstellung 
der Rautiefe in der Produktion als objektives Qualitätskriterium (siehe 
Abschnitt 6.2.2), auf einer Lösung zur automatischen und zuverlässigen 
Überprüfung der Maschine (siehe Abschnitt 6.3) und auf Modellen, die 
den Zusammenhang zwischen den Prozessparametern und einzelnen 
Qualitätsmerkmalen abbilden und die bei der Ermittlung neuer LTTs zur 
Unterstützung eingesetzt oder gleich als Ersatz für die LTTs verwendet 
werden könnten (siehe Abschnitt 6.4.2, 6.4.3 bzw. 6.4.4). In Abschnitt 6.4.1 
wird außerdem gezeigt, wie die Visualisierung von CNNs Unterstützung 
bei Schneidproblemen leisten könnte. 


2.5 Diskussion des Stands der Technik 


Der in diesem Kapitel beschriebene Stand der Technik sowie das Vorgehen 
in der Praxis bergen bereits ein großes Verbesserungspotential in sich. Wie 
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dringlich weitreichende Entwicklungen sind, wird bei der Betrachtung 
der veränderten und sich verändernden Anforderungen an die fertigende 
Industrie deutlich. 

Die fertigende Industrie ist ein sehr etablierter Industriezweig. Unge- 
fähr 9% aller Firmen und 28,5 Millionen Beschäftigte in der EU sind 
diesem Sektor zuzuordnen. Die generierte Wertschöpfung betrug 2017 
1820 Milliarden Euro, was fast einem Drittel der gesamten in der Eurozone 
gewerblich erwirtschafteten Wertschöpfung entspricht. [Eur17] 

Parallel zu den in Kapitel 1 genannten Herausforderungen befindet sich 
die fertigende Industrie mitten in einem großen Veränderungsprozess, der 
im deutschen Sprachgebrauch mit Industrie 4.0 beschrieben wird. Im Eng- 
lischen spricht man von smart manufacturing (dt. intelligente Fertigung). 
Diese Veränderung wird auch alle Unternehmen betreffen, die in der Laser- 
materialbearbeitung tätig sind. Kusiak [Kus18] stellt zehn Vermutungen 
auf, wie die Fertigung der Zukunft aussehen könnte. Im Kontext dieser 
Arbeit sind die folgenden Punkte besonders relevant: 


= Digitalisierung und damit zunehmende Abhängigkeit von Daten. 
= Einsatz von Modellierungs- und Simulationswerkzeugen. 
= Nutzung von Überwachungs- und Diagnosesysteme. 


Sowohl im Fertigungsumfeld im Allgemeinen als auch bei anderen Laser- 
materialbearbeitungsverfahren ist der Stand der Technik bezüglich der 
obigen drei Punkte weiter fortgeschritten als im Laserschneiden (siehe 
dazu auch Abschnitt 3.2.5). Für diese Diskrepanz könnte es verschiedene 
Gründe geben: 


Datenverfügbarkeit und -generierung Komplexe ML-Modelle erfordern 
große Datenmengen. Alle in diesem Kapitel zitierten Arbeiten verwen- 
den entweder Simulationsdaten [Ter+16; Ter+17] oder eine sehr geringe 
Anzahl selbst generierter experimenteller Daten [CBB20; MR12a; MR12b; 
MRI2c; TLC08]. Während es beim Schweißen öffentlich verfügbare Daten 
gibt (z.B. GDXray [Mer+15]), ist die Existenz einer solchen Datenbank für 
das Laserschneiden nicht bekannt. Ein Grund für die kleinen Datensät- 
ze ist vermutlich, dass die Datengenerierung beim Laserschneiden sehr 
aufwendig ist, weil die Schnittkante während des Schneidens nicht zu 
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sehen ist und die Datenerfassung deshalb nachgelagert stattfinden muss. 
Die Zusammenführung der Informationen aus verschiedenen Datenquel- 
len ist herausfordernd. Ähnliche Gründe könnten auch für das Fehlen 
ganzheitlicher Überwachungs- und Diagnosesysteme verantwortlich sein. 


Interpretierbarkeit Mit den bislang verfügbaren Datensätzen und den 
eingesetzten Modellen lässt sich das große Potential von Methoden des 
maschinellen Lernens kaum nutzen. Komplexe Modellansätze, z.B. tiefe 
neuronale Netze, sind jedoch nur schwer zu interpretieren. Deshalb gibt 
es teilweise große Vorbehalte, diese Methoden einzusetzen. Die Tatsache, 
dass der Laserschneidprozess nicht vollständig verstanden ist, könnte in 
dieser Hinsicht besonders hinderlich sein, weil die Modellierung in einem 
solchen Fall auch zur Erweiterung des Verständnisses beitragen sollte. 
An der Interpretierbarkeit neuronaler Netze wird aber intensiv geforscht. 
Mehr dazu befindet sich in Abschnitt 3.2.6. 


Unternehmensgröße Laserschneidmaschinen werden häufig von klei- 
nen Firmen eingesetzt [Lei08], die als Auftragsfertiger oder Zulieferer 
arbeiten. Solche Unternehmen haben keine eigenen Entwicklungsabtei- 
lungen, die die Digitalisierung der Fertigung vorantreiben könnten. Da 
gerade kleinen Firmen ein Fachkräftemangel bevorstehen könnte [Mal+19], 
sind Modellierungs- und Diagnosesysteme besonders wichtig, weil sie die 
Bedienung vereinfachen und Unterstützung aus der Ferne ermöglichen. 


Industrielle Reife Ein weiterer Punkt ist sicherlich, dass Laserschneiden 
seit vielen Jahrzehnten industriell eingesetzt wird und bereits eine große 
technische Reife erreicht hat. 
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In diesem Kapitel werden zunächst die Grundlagen des maschinellen 
Lernens erklärt. Anschließend folgen eine ausführliche Einführung in 
künstliche neuronale Netze und ein Einblick in den Stand der Technik von 
Anwendungen dieser Modelle im Fertigungskontext. 


3.1 Grundlagen 


Maschinelles Lernen ist ein Teilbereich der künstlichen Intelligenz. Der 
Begriff wurde 1959 von Samuel [Sam59] geprägt. Er schrieb, dass maschi- 
nelles Lernen Computern die Fähigkeit verleihe zu lernen, ohne explizit 
programmiert zu werden. Mitchell [Mit97] erklärte die Grundidee so: Ein 
Computerprogramm lerne aus einer Erfahrung E bezogen auf eine Auf- 
gabe T und bewertet mit dem Leistungsmaß P, wenn die Leistung des 
Programms bei Aufgaben T (gemessen mit P) mit steigender Erfahrung E 
zunehme. Während bei der expliziten Programmierung aus der (Nicht-) Er- 
füllung einer Bedingung eine Aktion folgt, gilt beim maschinellen Lernen: 
Aus Daten entsteht ein Modell und aus diesem folgt eine Aktion. Mithilfe 
geeigneter Modellalgorithmen werden Muster oder Gesetzmäßigkeiten 
aus Lerndaten (von Mitchell [Mit97] als Erfahrung E bezeichnet) extrahiert. 
Anschließend kann das Modell auch für unbekannte Daten verwendet 
werden. 

Obwohl das Konzept des maschinellen Lernens schon viele Jahrzehnte 
alt ist, hat dessen Popularität erst in den letzten Jahren stark zugenommen. 
Dies ist der zunehmenden Rechen- und Speicherkapazität und der Verfüg- 
barkeit großer Datenmengen zu verdanken. Insbesondere in Bereichen, in 
denen eine explizite Programmierung schwierig ist, konnten damit große 
Erfolge erzielt werden (z. B. IBM-Watson [Hig12], DeepFace [Tai+14)). 
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Die Methoden des maschinellen Lernens lassen sich grob in drei Grup- 
pen unterteilen: überwachtes, unüberwachtes und verstärkendes Lernen 
(engl. reinforcement learning). In dieser Arbeit kommt nur überwachtes 
Lernen zum Einsatz. Dabei wird eine Funktion aus Paaren von Ein- und 
Ausgangsdaten erlernt. Man weiß bereits (oder nimmt an), dass eine Be- 
ziehung zwischen Ein- und Ausgabe existiert. Der Algorithmus muss 
lediglich die Zusammenhänge entschlüsseln und abbilden. Beispiele für 
Algorithmen zum überwachten Lernen sind lineare Regression, Entschei- 
dungsbäume und künstliche neuronale Netze (KNNs). [HTF09] 


3.1.1 Wichtige Begriffe 


Im Folgenden werden Grundbegriffe des überwachten maschinellen Ler- 
nens eingeführt. 


3.1.1.1 Approximation einer Funktion 


Beim überwachten maschinellen Lernen geht es darum, eine Funktion f 
zu approximieren, die die allgemeine Form 


= f(£) +T (3.1) 


hat. Dabei wird x Input, Merkmal(e), Eingangs- oder unabhängige Varia- 
ble(n) genannt, 5 Output, Ausgangs- oder abhänge Variable. Der zufällige 
Fehlerterm 7 hat einen Mittelwert von 0 und enthält z.B. nicht erfasste 
Variablen, die nützlich für die Vorhersage von y wären [Jam+13]. Die Funk- 
tion f beinhaltet die systematische Information, die in x über ĝ enthalten 
ist und ist meist unbekannt. Die Methoden des maschinellen Lernens fas- 
sen eine Vielzahl von Ansätzen zusammen, die alle das Ziel haben, den 
tatsächlichen Zusammenhang f mithilfe einer Funktion f (dem Modell) 
zu approximieren. Das Ziel ist es also, eine Funktion f zu finden, für die 
gilt: 5 ~ f(a) Va. Die zwei Hauptgründe für die Approximation von f 
durch f sind die Vorhersage und die Erklärbarkeit. 
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Vorhersage In vielen Fällen sind die unabhängigen Variablen verfüg- 
bar, die abhängigen jedoch nicht. Dann kann f genutzt werden, um eine 
Vorhersage 


y = f(x) (3.2) 


für ĝ zu treffen. Die Genauigkeit der Vorhersage hängt von zwei Größen 
ab, dem reduzierbaren und dem nicht reduzierbaren Fehler [Jam+13]: Der 
reduzierbare Fehler hängt damit zusammen, dass f keine perfekte Ap- 
proximation für f ist. Dieser Fehler kann also reduziert werden, indem 
die Approximation verbessert wird, was beispielsweise durch die Ver- 
wendung flexiblerer Modelle erreicht werden kann. Diese bergen jedoch 
die Gefahr der Überanpassung (engl. overfitting) in sich (siehe Abschnitt 
3.1.2.1). Der nicht reduzierbare Fehler wird durch die Abhängigkeit von ĝ 
vom Fehlerterm r hervorgerufen, welcher nicht von « abhängt. Er stellt 
die Grenze für die erreichbare Vorhersagegenauigkeit dar und ist in der 
Praxis normalerweise nicht bekannt. 


Erklärbarkeit Oft möchte man verstehen, wie y von x abhängt. Zum 
Beispiel kann es interessant sein, welche unabhängigen Variablen für die 
Vorhersage relevant sind oder wie die Beziehung zwischen einer unabhän- 
gigen Variable und dem Output ist. 


Kompromiss zwischen Genauigkeit und Interpretierbarkeit Jenachdem 
ob das Ziel der Approximation von f das Treffen möglichst genauer Vor- 
hersagen oder die Erklärbarkeit der Zusammenhänge oder beides ist, 
können unterschiedliche Approximationsmethoden vorteilhaft sein. Für 
die Verbesserung der Genauigkeit ist meist die Erhöhung der Modellkom- 
plexität nötig, was die Interpretierbarkeit erschwert. In der Regel muss 
deshalb ein Kompromiss eingegangen werden zwischen der Genauigkeit 
der Vorhersage und der Interpretierbarkeit zur Erweiterung des Verständ- 
nisses [Jam+13]. 


3.1.1.2 Klassifikation und Regression 


Je nachdem ob es sich bei der abhängigen Variable um eine quantitative 
oder qualitative (auch kategorische) handelt, liegt ein Regressions- oder ein 
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Klassifikationsproblem vor. Quantitative Variablen nehmen numerische 
Werte an, qualitative sind dagegen diskreten Klassen zuzuordnen. Oft 
lassen sich Probleme je nach Definition sowohl als Regressions- als auch als 
Klassifikationsaufgabe betrachten und viele Methoden des maschinellen 
Lernens können auf beide Fälle angewendet werden. 


3.1.1.3 Training, Validierung und Test 


Training Für die Approximation von f mit f können unterschiedliche 
Methoden zum Einsatz kommen. Allen gemeinsam ist, dass die Anpas- 
sung mithilfe von N Beispieldatenpunkten geschieht und als Training des 
Modells bezeichnet wird. Die Beispieldaten werden deshalb als Trainings- 
daten bezeichnet. Der Trainingsdatensatz {(æ1, 1), (£2, 92), ---, (en, Iv)} 
besteht aus N Input-Output Paaren (x,„,%,) mitn € {1,2,.... N}, wobei 
Ln = (nina np) ER’ der n-te Eingangsdatenpunkt und 9, € R 
der zugehörigen Output ist. Dieser wird auch Label (dt. Beschriftung) 
genannt. 

Der nächste Schritt unterscheidet sich für parametrische und nicht para- 
metrische Methoden. Bei letzteren werden keinerlei Annahmen bezüglich 
der Funktion f getroffen. Diese Methode kommt in der vorliegenden Ar- 
beit nicht zum Einsatz und wird deshalb nicht weiter beschrieben. Bei 
den parametrischen Methoden wird im ersten Schritt eine Vermutung 
hinsichtlich der Funktion f aufgestellt, was das Problem sehr vereinfacht. 
Dafür muss man allerdings in Kauf nehmen, dass die angenommene Funk- 
tion f nicht perfekt zur tatsächlichen Form von f passen könnte. Kann 
beispielsweise angenommen werden, dass es sich bei einer Regression um 
einen linearen Zusammenhang handelt, dann ist 


fuwl) = wo + wızı + Waza +... + Wpxp (3.3) 


die gesuchte Funktion [Jam+13]. Die Modellparameter werden auch als 
Gewichte bezeichnet. Nicht alle von ihnen spielen dieselbe Rolle. Geo- 
metrisch definieren die Gewichte (engl. weights) w1, ws, ..., wp die Winkel 
der aufgespannten Hyperebene bezogen auf die Koordinatenachsen. Der 
sogenannte Bias wọ beschreibt dagegen eine Verschiebung der Hyperebene 
aus dem Koordinatenursprung [Kub15]. 


36 


3.1 Grundlagen 


Analog dazu kommt bei Klassifikationsproblemen im binären Fall (also 
bei zwei Klassen {0, 1}) die logistische Regression zum Einsatz [Jam+13]: 


0, fürpr< 0,5 
ost 

1, fürpr > 0,5 
(3.4) 


(wo tw 2, +Wetet...twpzp) 


mit pe= 1+ eWwotwizıtwazz+...twpzp) : 
Hier gibt pr die Wahrscheinlichkeit dafür an, dass ein Datenpunkt x zur 
Klasse y = 1 gehört. 

Nach der Auswahl der Funktion müssen die Modellparameter w mit- 
hilfe der Trainingsdaten dahingehend optimiert werden, dass gilt: 7 ~ 
f(x) Vx. Dafür gibt es verschiedene Methoden. Für jede Wahl der Parame- 
ter ergibt sich ein anderes Modell. 


Kostenfunktion Für die Optimierung der Modellparameter wird eine 
Kosten- oder Verlustfunktion E(w) (engl. error function) definiert, die 
minimiert werden soll. Diese Funktion beschreibt die Güte der Modellvor- 
hersage, indem sie den Output des Modells mit dem jeweils gewünschten 
Output (d.h. dem Label) für jedes Trainingsbeispiel vergleicht. Es gibt 
verschiedene Möglichkeiten, die Kostenfunktion zu definieren. Ein für 
Regressionsaufgaben häufig gewählter Ansatz ist die Minimierung des 
über alle N Trainingsbeispiele gemittelten quadratischen Fehlers zwischen 
der Modellvorhersage y, und dem Label %,. Die Kostenfunktion lautet 
dann [Jam+13]: 


1 N 


nm \2 
E(w) = + 2 Celen) =bn)". (3.5) 
E =Yn 
Weitere Metriken, die als Verlustfunktion eingesetzt werden können, sind 
in Abschnitt 3.1.2 zu finden. 


Als Trainingsdaten für die Optimierung der Modellparameter werden 
nicht alle verfügbaren Daten verwendet, sondern nur eine Teilmenge. Die- 
se wirken sich unmittelbar auf das Modell aus. Der vorhandene Datensatz 
wird in drei disjunkte Teilmengen aufgeteilt: Trainings-, Validierungs- und 
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Testdaten. Es gibt verschiedene Methoden, die Daten aufzuteilen. Zum 
Beispiel kann die Aufteilung zufällig erfolgen oder hinsichtlich bestimmter 
Verteilungen der vorhandenen Klassen. Üblicherweise beinhaltet der Trai- 
ningsdatensatz den größten Anteil der vorhandenen Daten, Validierungs- 
und Testdatensatz sind ungefähr gleich groß. Die Validierungs- und die 
Testdaten werden für die Evaluierung der Modellgüte mithilfe einer geeig- 
neten Metrik verwendet [KJ13]. 


Validierung Die Validierungsdaten werden während des Entwicklungs- 
prozesses eines Modells genutzt, um die Auswirkungen verschiedener 
Hyperparameter auf die Modellgüte zu bewerten. Bei den Hyperparame- 
tern handelt es sich um Parameter „höherer Ebene“, z.B. die Annahme 
eines quadratischen statt eines linearen Zusammenhangs oder die Anzahl 
der Schichten eines neuronalen Netzes. Die Validierungsdaten wirken sich 
deshalb (durch etwaige Anpassungen der Hyperparameter) indirekt auf 
das Modell aus. 


Test Die Testdaten kommen erst dann zum Einsatz, wenn die Hyperpara- 
meter des Modells festgelegt und das Modell auf Basis der Trainingsdaten 
trainiert wurde [RND10]. Die Modellgüte wird damit auf unbekannten 
Daten evaluiert, die keinerlei Einfluss auf das Modell hatten. Nur der 
Testfehler gibt eine verlässliche Auskunft über die Fähigkeit des Modells, 
Vorhersagen für unbekannte Eingangsdaten zu treffen. 


Kreuzvalidierung Anstatt ein Modell auf einem Trainingsdatensatz zu 
trainieren und auf einem Validierungsdatensatz zu evaluieren, wird häufig 
die sogenannte Kreuzvalidierung verwendet, um eine verlässliche Aussa- 
ge über die Modellgüte und die Sensitivität hinsichtlich der Aufteilung 
der Daten zu erhalten. Die bekannteste Methode ist die k-fache Kreuz- 
validierung. Die zur Verfügung stehende Datenmenge (ohne Testdaten) 
wird dabei in k gleichgroße Teilmengen aufgeteilt. Anschließend werden 
k Durchläufe gestartet, bei denen jeweils k — 1 Teilmengen als Trainings- 
daten verwendet werden und die verbleibende Teilmenge zur Validierung 
eingesetzt wird [Jam+13]. Anschließend werden der Durchschnitt und die 
Verteilung der Fehler der k Durchläufe berechnet. 
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3.1.2 Evaluierung der Modellgüte 


Um die Güte eines Modells zu quantifizieren, um also zu beurteilen, wie 
gut die vom Modell getroffenen Vorhersagen zu den tatsächlichen Da- 
tenpunkten passen, wird eine geeignete Metrik benötigt. Die Metriken 
sind hier für den allgemeinen Fall eines Modells mit mehreren Ausgängen 
y definiert. y,,,, beschreibt dabei den Wert des m-ten Ausgangs für den 
n-ten Datenpunkt. Für Regressionsprobleme wird meistens der mittlere 
quadratische Fehler (engl. mean squared error) 


N M 


MSE = 7,73. I (nm — Dam)” (3.6) 


n=1m=1 


benutzt [Jam+13], mit der Anzahl der Datenpunkte (des Trainings-, 
Validierungs- oder Testdatensatzes) N und der Anzahl abhängiger Va- 
riablen M. Das Label oder der wahre Wert ist am, die Modellvorhersage 
ist Ynm- 

Eine andere Möglichkeit, bei der einzelne große Fehler weniger stark ins 
Gewicht fallen, ist der mittlere absolute Fehler (engl. mean absolute error) 


N M 


n=1m=1 


Im Falle von Klassifikatoren ist die Korrekt-Klassifikationsrate (engl. 
classification accuracy) 


11 N M 
CA=1- 2N 5 5 [Ynm ~~ Ünml (3.8) 


n=1m=1 


eine häufig verwendete Qualitätsmetrik. Sie beschreibt den Anteil der 
korrekten Klassenzuordnungen. Hier bezeichnet N ebenfalls die Anzahl 
der Datenpunkte, M die Anzahl der Klassen, „m die wahre und y,, die 
vorhergesagte Klasse. Bei mehreren Ausgängen erhält der wahrschein- 
lichste Ausgang bei der Vorhersage den Wert 1 und alle anderen den Wert 
0 (engl. one-hot encoding) [Fril4]. Falls die wahre und die vorhergesagte 
Klasse übereinstimmen, verschwindet der Term innerhalb des Summen- 
zeichens, ansonsten ist er 1. Warum durch 2 geteilt wird, lässt sich am 
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Beispiel mit zwei Ausgängen (M = 2) leicht verstehen: Wenn die Vorher- 
sage eines Trainingsbeispiels nicht korrekt ist, ist sowohl |y„ı — inı| = 1 
als auch |yn2 — §n2| = 1. Damit dieser Fehler nicht doppelt eingeht, muss 
durch 2 geteilt werden. CA beschreibt den Anteil der korrekt zugeordne- 
ten Beispiele einer Klasse bezogen auf die Gesamtanzahl aller Beispiele im 
Datensatz. Bei unausgeglichenen Anteilen der Klassen im Datensatz ist die 
gewichtete Korrekt-Klassifikationsrate (engl. balanced classification accuracy, 
BCA) aussagekräftiger. Die Anzahl der korrekt klassifizierten Beispiele 
einer Klasse wird dabei nur auf die Anzahl der Beispiele dieser Klasse im 
Datensatz bezogen. Anschließend wird über alle Klassen gemittelt. Bei 
einer binären Klassifikation, bei der 99% der Datenpunkte zu Klasse 1 
und 1% zu Klasse 0 gehören, wäre die CA 99%, wenn das Modell immer 
Klasse 1 vorhersagt. Die BCA wäre dagegen nur 50 %. 

Zur Beurteilung der Klassifikationsgüte wird außerdem oft die soge- 
nannte Wahrheitsmatrix verwendet [Jam+13]. Diese ist in Tabelle 3.1 für 
eine binäre Klassifikation zu sehen. Sie beinhaltet die Häufigkeiten für vier 
verschiedene Fälle: richtig positiv (rp), falsch negativ (fn), falsch positiv 
(fp) und richtig negativ (rn). Worum es sich dabei handelt, lässt sich am 
besten an einem Beispiel verstehen: Angenommen ein Modell soll anhand 
eines Bildes vorhersagen, ob ein Produkt einen Defekt hat (1) oder nicht 
(0). Richtig positiv sind alle Fälle, bei denen das Modell einen Defekt vor- 
hersagt und die auch tatsächlich einen Defekt aufweisen. Zu den falsch 
negativen Vorhersagen werden alle Vorhersagen des Modells gezählt, bei 
denen kein Defekt erkannt wird, tatsächlich aber einer vorliegt. Bei den 
falsch positiven ist es gerade umgekehrt. Richtig negativ sind die Fälle, 
bei denen weder ein Defekt erkannt wird noch einer vorliegt. Die Korrekt- 
Klassifikationsrate lässt sich dann auch als Verhältnis von (rp + rn) zu 
(rp + fp + fn + rn) ausdrücken. Aus der Wahrheitsmatrix können außer- 
dem die Precision (dt. Klassifikationsgenauigkeit), das Verhältnis von rp 
zu (rp + fp), und der Recall (dt. Sensitivität), das Verhältnis von rp zu 
(rp + fn), abgeleitet werden. 

Eine weitere Möglichkeit, die Güte eines Klassifikators zu beschreiben, 
ist die kategorische Kreuzentropie (engl. categorical cross-entropy) [Mur12]: 


CCE = y y y Dam 10g (Ynm) (3.9) 
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Tabelle 3.1 Die Wahrheitsmatrix für eine binäre Klassifikation beinhaltet die Häufigkeiten 
der vier Fälle: richtig positiv (rp), falsch negativ (fn), falsch positiv (fp) und richtig negativ 


(rn). 


Wahrheit 
1 0 
p fp 


Vorhersage 0 ft t 


log ist hier der natürliche Logarithmus. Während die Labels ĝ„m als one- 
hot Vektor n vorliegen, beinhaltet der Vektor der Vorhersagen y,, Werte 
Ynm zwischen 0 und 1, die in Summe gerade 1 ergeben [Bis06]. Diese 
können als Wahrscheinlichkeiten der Klassen interpretiert werden. Die 
CCE nimmt stets positive Werte an, wobei 0 für ein perfektes Modell 
steht, welches immer (mit der Wahrscheinlichkeit 1) die korrekte Klasse 
vorhersagt. 


3.1.2.1 Bias-Varianz-Dilemma 


Die Abweichung zwischen dem vom Modell vorhergesagten und dem 
wahren Wert hängt von drei fundamentalen Größen ab, dem nicht redu- 
zierbaren Fehlerterm r (siehe Formel (3.1)) sowie der Varianz und dem 
Bias (dt. Voreingenommenheit, Verzerrung) [Jam+13]. Das Bias-Varianz- 
Dilemma (engl. bias-variance tradeoff) beschreibt die Schwierigkeit der 
gleichzeitigen Minimierung dieser zwei Fehlerquellen. 

Die Varianz beschreibt den Einfluss einer Änderung der Trainingsdaten 
auf das Modell f. Ein Modell mit einer hohen Varianz reagiert empfindlich 
auf einzelne Datenpunkte. Anstatt die systematische Beziehung zwischen 
Ein- und Ausgang abzubilden, modelliert es das Rauschen in den Trai- 
ningsdaten. Dieses Problem wird auch als Überanpassung bezeichnet. Ob 
ein Modell mit hoher Varianz vorliegt, kann man durch einen Vergleich 
des Trainings- und des Validierungsfehlers herausfinden. Ist der Trainings- 
fehler deutlich kleiner als der Validierungsfehler, liegt Überanpassung vor. 
Ein Beispiel für ein überangepasstes Modell ist in Abbildung 3.1(a) zu 
sehen. Ein hoher Bias tritt auf, wenn ein komplexer realer Zusammenhang 
mit einem (vergleichsweise) einfachen Modell approximiert wird. Werden 
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0,0 0,5 1,0 0,0 0,5 1,0 
T ax 
(a) Zu hohe Varianz. (b) Zu hoher Bias. 


0,0 0,5 1,0 


(c) Guter Kompromiss. 


Abbildung 3.1 Beispiele für ein Modell mit zu hoher Varianz, zu hohem Bias und für ein 
Modell mit einem guten Kompromiss zwischen Bias und Varianz. 


beim Aufstellen der Vermutung hinsichtlich des Zusammenhangs zwi- 
schen unabhängigen und abhängigen Variablen (siehe Abschnitt 3.1.1.3) 
falsche Annahmen getroffen und führen diese dazu, dass die Beziehungen 
unabhängig von der Anzahl der Trainingsbeispiele nicht richtig modelliert 
werden können, weist das Modell einen Bias auf. Dieses Problem wird 
auch als Unteranpassung bezeichnet. Ein Beispiel dafür ist in Abbildung 
3.1(b) gezeigt. Ob Unteranpassung vorliegt, ist nicht leicht herauszufinden. 
Ein hoher Bias führt zu einem hohen Trainings- und einem ähnlich hohen 
Validierungsfehler. Die Beurteilung der Größe eines Fehlers hängt jedoch 
stark von der jeweiligen Situation und Aufgabenstellung ab. 

Je nachdem ob ein Modell mit einem hohen Bias oder einer hohen 
Varianz vorliegt, sollten verschiedene Ansätze zur Problembehebung her- 
angezogen werden. Um den Bias zu reduzieren, wird üblicherweise die 
Modellkomplexität erhöht [HTF09]. Da es dadurch zu einer Erhöhung 
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der Varianz kommen kann, muss stets ein Kompromiss gefunden wer- 
den. Die Reduzierung der Varianz kann man neben der Verringerung der 
Modellkomplexität beispielsweise auch durch das „rechtzeitige“ Beenden 
des Optimierungsprozesses oder durch die sogenannte Regularisierung 
im Trainingsprozess erreichen [BG11]. Dabei wird verhindert, dass der 
Einfluss einzelner Modellparameter zu groß wird, z.B. durch Hinzufügen 
eines weiteren Terms zur Kostenfunktion. Ein Beispiel für einen guten 
Kompromiss zwischen Bias und Varianz ist in Abbildung 3.1(c) zu finden. 


3.1.3 Arbeitsablauf eines ML-Projektes 


Der Arbeitsablauf eines ML-Projektes kann in fünf Phasen gegliedert wer- 
den, die gegebenenfalls mehrfach durchlaufen werden müssen [Pan19]: 


» Daten generieren/sammeln 

= Datenvorverarbeitung (siehe z. B. Abschnitt 4.2.2.1) 

= Datenanalyse und Modellauswahl (inkl. Merkmalsdesign) 
= Trainieren, Validieren und Testen des Modells 

= Evaluierung. 


Diese Phasen wurden auch bei der Erstellung der vorliegenden Arbeit 
durchlaufen. Wie sie miteinander und mit vor- und nachgelagerten Ar- 
beitsschritten zusammenhängen, ist in Abbildung 3.2 veranschaulicht. 
Eine in der Praxis häufig angewandte Schätzung ist, dass ca. 80 % der Zeit 
für die Datenvorverarbeitung investiert werden müssen und nur ca. 20 % 
der Zeit für die Modellauswahl, das Training und die Evaluierung zur 
Verfügung stehen [Pan19]. Damit decken sich auch die Ergebnisse des 
CrowdFlower Data Science Reports [Cro16]. Dieser macht transparent, 
dass Datenwissenschaftler (engl. data scientists) durchschnittlich 78 % ihrer 
Arbeitszeit mit der Bereinigung, der Organisation und der Erfassung von 
Daten verbringen. 10% der Zeit wenden sie für das Design geeigneter 
Trainingsdatensätze auf und nur 3 bzw. 4% der Zeit verbleiben für die 
Analyse der Daten und die Entwicklung der Algorithmen. Es ist davon 
auszugehen, dass sich diese Anteile im industriellen Umfeld noch weiter 
verschieben, weil die Datengenerierung und -bereinigung dort oft sehr 
aufwendig sind. 
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Abbildung 3.2 Arbeitsablauf eines ML-Projektes, beginnend mit der Formulierung der 
Problemstellung, frei nach Pant [Pan19] und Visengeriyeva et al. [Vis+21]. 


3.2 Künstliche neuronale Netze 


Bei den parametrischen Methoden wird zunächst eine Vermutung f (ge- 
nauer: fw) hinsichtlich des systematischen Zusammenhangs zwischen Ein- 
und Ausgangsgrößen aufgestellt und dann werden die Parameter dieser 
Funktion bestimmt. Bislang wurden für f nur die beiden sehr einfachen 
Ansätze der linearen und der logistischen Regression in den Formeln (3.3) 
und (3.4) eingeführt. Eine andere Möglichkeit, die die Approximation 
komplexer Zusammenhänge ermöglicht, sind künstliche neuronale Netze. 

Künstliche neuronale Netze wurden inspiriert von biologischen neu- 
ronalen Netzen und der Vernetzung von Neuronen im Nervensystem 
eines Lebewesens. Das Ziel bei ihrer Verwendung ist nicht, das biologische 
Vorbild exakt nachzubilden, sondern die Verarbeitung von Informationen 
und die Modellbildung. Künstliche neuronale Netze bestehen aus vielen 
kleinen Einheiten, den sogenannten Neuronen, die mithilfe gewichteter 
Verbindungen zu größeren Strukturen verbunden werden [Kub15]. Die 
Anfänge gehen auf McCulloch und Pitts [MP43] zurück, die bereits in den 
1940er Jahren ein Netzwerk bestehend aus Verknüpfungen elementarer 
Einheiten vorstellten. 

Neuronale Netze sind universelle Approximatoren (Universelles Appro- 
ximationstheorem [Pin99]). Das bedeutet, dass damit jede stetige Funktion 
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beliebig genau approximiert werden kann und dass diese Modelle prinzi- 
piell auf jedes beliebige Problem angewendet werden können. Das Uni- 
verselle Approximationstheorem erklärt jedoch nicht, wie viele Neuronen 
dafür nötig sind und wie die Modellparameter gewählt werden müssen. 
Obwohl sicher ist, dass eine Lösung existiert, kann nicht garantiert werden, 
dass sie gefunden wird [Kub15]. 


3.2.1 Grundlagen künstlicher neuronaler Netze 


Das Netz wird durch eine Funktion f beschrieben. Ein vorwärts gerichte- 
tes Netz besteht aus L Schichten und jede Schicht besteht aus mehreren 
Neuronen. Die Werte der Neuronen werden als Aktivierungen bezeichnet. 
Bei a handelt es sich um die Aktivierung des i-ten Neurons der /-ten 
Schicht. Der Input wird an die Neuronen der ersten Schicht ! = 1 überge- 
ben, a) = x, und durch das Netz auf den Output in der letzten Schicht 
l = L abgebildet: y = a). Die Schichten 2 bis L — 1 sind die sogenannten 
verdeckten Schichten (engl. hidden layers). [Kub15] 

Fur die Schichten gilt Folgendes: Die Aktivierungen der Schicht a 
werden mithilfe einer nicht linearen Transformation H; ;,, aus den Werten 


(1+1) 


der davor liegenden Schicht a“) berechnet: 
a) = Hyry (a, Wii) - (3.10) 


Bei H,141 handelt es sich oft um die Verkettung einer affinen Transfor- 
mation von a"), die mit W H, 14, Parametriert ist, mit einer nicht linearen 
Aktivierungsfunktion [SGS15]. Die Eingangsinformation wird an die Neu- 
ronen der ersten Schicht übergeben und dann Schicht für Schicht über 
gewichtete Verbindungen weitergegeben bis zum Ausgang. Dieser Prozess 
wird als Vorwärts-Propagation (engl. forward propagation) bezeichnet. 


3.2.1.1 Vollständig verbundene neuronale Netze 


In einem vollständig verbundenen neuronalen Netz (engl. fully connected, 
FC) ist jedes Neuron a, einer Schicht l + 1 mit jedem Neuron a; der davor 
liegenden Schicht / über eine mit w,, gewichtete Verbindung vernetzt. Ein 
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Schicht Schicht Schicht Schicht Schicht 
1 l 1+1 L-1 L 


Abbildung 3.3 Vollständig verbundenes neuronales Netz. Als Eingangsinformation wird 
hier ein Bild übergeben. Dabei erhält jedes Neuron der ersten Schicht den Wert eines Pixels. 
Andere Eingangsdaten sind ebenfalls möglich. Die Information wird Schicht für Schicht durch 
das Netz propagiert (im Bild von links nach rechts), wobei die Verbindungen zwischen den 


Neuronen mit ore gewichtet sind. Um die Aktivierung ao eines Neurons zu berech- 


nen, kommt nach dem Aufsummieren aller gewichteten Aktivierungen der vorhergehenden 
Schicht ! und dem (nicht eingezeichneten) Bias eine nicht lineare Aktivierungsfunktion zum 
Einsatz. Das gezeigte neuronale Netz hat einen Ausgang, mehrere sind genauso méglich. 


solches Netz ist in Abbildung 3.3 zu sehen. Die allgemeine Form eines 
solchen Netzes ist [Mon+17]: 


alt) = act 5 a) . 


j 


ge) BE (3.11) 
mit al) = x, und y; = ae Mit act wird die nicht lineare Aktivierungs- 
funktion beschrieben. Weitere Informationen dazu befinden sich im nächs- 
ten Abschnitt. Der sogenannte Bias-Term b; ermöglicht eine Verschiebung 
der Aktivierungsfunktion. Er ist hier der Vollständigkeit halber aufge- 
führt, wird im Folgenden jedoch für eine einfachere Lesbarkeit häufig 
weggelassen. Sowohl b; als auch die Gewichte w;; werden während des 


Trainingsprozesses optimiert. 


3.2.1.2 Aktivierungsfunktionen 


Die Aktivierungsfunktion integriert eine nicht lineare Komponente in das 
neuronale Netz. Ohne diese könnte es den Eingang (unabhänig von der 
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Anzahl der Neuronen/Schichten) nur linear auf den Ausgang abbilden. 
Erst die Verwendung der Aktivierungsfunktion ermöglicht die Modellie- 
rung komplexer Zusammenhänge. Die Aktivierungsfunktion wird, wie in 
Formel (3.11) gezeigt, in jedem einzelnen Neuron auf die gewichtete Sum- 
me der Aktivierungen der Vorgängerschicht angewendet. Sie bestimmt, ob 
das Neuron aktiviert wird oder nicht. Es gibt verschiedene häufig verwen- 
dete Aktivierungsfunktionen mit unterschiedlichen Vor- und Nachteilen. 
Im Folgenden werden nur Funktionen eingeführt, die in dieser Arbeit 
verwendet werden. 


Logistische Funktion Bei der logistischen Funktion handelt es sich um 
einen Spezialfall der Sigmoid-Funktion: 

t(t) I (3.12) 

act(t) = — . : 
1+e* 

Die Vorteile der logistischen Funktion sind, dass der Ausgangswert stets 
zwischen 0 und 1 liegt und dass keine Sprünge im Gradienten auftreten. 
Nachteilig ist, dass der Gradient für sehr große oder sehr kleine Eingangs- 
werte verschwindet (engl. vanishing gradient problem [KKO1]). Dies kann 
zu Problemen wie z. B. einer langsamen Trainingskonvergenz führen. Des 
Weiteren ist die logistische Funktion verglichen mit anderen Aktivierungs- 
funktionen rechenaufwendig. 


ReLU und PReLU Die ReLU-Aktivierungsfunktion (engl. rectified linear 
unit) und ihre Erweiterung, die PReLU (engl. parameterized ReLU), werden 
häufig verwendet. Die Formel lautet [He+15]: 


act(t) = max(0,t) + a: min(0, t), (3.13) 


wobei fiir die ReLU a = 0 und für die PReLU a ¥ 0 gilt. Der Rechenauf- 
wand der ReLU ist geringer, der Gradient verschwindet jedoch vollstandig 
im Falle negativer Eingangswerte. Der Trainingsprozess stagniert dann. 
Dieses Problem wird mit der Erweiterung der ReLU zur PReLU behoben. 
Der Parameter a wird wahrend des Trainingsprozesses ebenfalls optimiert. 
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3.2.2 Faltende neuronale Netze 


Faltende neuronale Netze sind eine spezielle Art künstlicher neurona- 
ler Netze, die besonders gut für die Verarbeitung von Informationen in 
Bildern geeignet sind. Sie zeichnen sich durch die folgenden vier Eigen- 
schaften aus [LBH15]: lokale Verbindungen, geteilte Gewichte, Pooling 
und Verwendung vieler Schichten. In den letzten Jahren wurden CNNs 
mit großem Erfolg für die Detektion, Segmentierung und Erkennung von 
Objekten in Bildern eingesetzt. Berühmte Architekturen sind beispiels- 
weise LeNet [LeC+98], AlexNet [KSH17] und das VGG-Netz [SZ15]. Auf 
die Grundelemente eines CNNs, die Faltungs- und die Pooling-Schichten, 
wird nun detaillierter eingegangen. Die Grundideen der beiden Operatio- 
nen sind in Abbildung 3.4 veranschaulicht. 


3.2.2.1 Faltungsschichten 


Am Eingang des CNNs wird ein Tensor mit den Dimensionen (Bildbreite) 
x (Bildhöhe) x (Kanäle) übergeben. Abweichend von der Notation in der 
restlichen Arbeit werden die Neuronen der Eingangs- und aller weiteren 
Faltungs- und Pooling-Schichten hier nicht als Vektor, sondern als Tensor 
angeordnet. Die verdeckten Schichten enthalten jeweils mehrere Tensoren 
zweiter Stufe, die sogenannten Feature Maps (dt. Merkmalskarten). Die 
Feature Maps einer Schicht sind alle gleich groß, ihre Anzahl wird auch als 
Tiefe der Schicht bezeichnet. Abweichend von den vollständig verbunde- 
nen Netzen wird die Aktivierung der Neuronen einer Feature Map Ath 
der Schicht } + 1 berechnet, indem ein Filter über die gesamte räumliche 
Dimension der Vorgängerschicht geschoben und anschließend über deren 
Tiefe addiert wird [LKF10]: 


A“ = act (are +Y KGT” + at) (3.14) 


U 


Zu beachten ist, dass u hier die Feature Maps der Schicht ! indiziert und 
v die Feature Maps der Schicht l + 1 und nicht die einzelnen enthaltenen 
Neuronen. Jede Feature Map A, der Schicht ! wird mit einem Faltungs- 
kern KOH) (dem Filter) gefaltet. Die Neuronen aufeinander folgender 


Schichten eines CNNs sind also durch die Parameter dieser Faltungsker- 
ne miteinander verbunden. Sie müssen während des Trainings optimiert 
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Filter KH) 


(a) Faltung mit einem Filter der Größe 3 x 3 und der Schrittweite 1. 


Feature Map 
AGH) 
Feature Map Av 


Max Pooling-Fenster 


(b) Max Pooling mit einer Fenstergröße von 2 x 2 und einer Schrittweite von 2. 


Abbildung 3.4 Beispiele für eine Faltung und für Max Pooling. 
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werden. Die Ergebnisse der Faltung werden über alle Feature Maps der 
Schicht | aufsummiert. Nachdem zusätzlich der Bias BED addiert und 
die nicht lineare Aktivierungsfunktion (auf jedes Neuron) angewendet 
wurde, ergibt sich die Feature Map A, der Schicht / + 1. 

Da die Faltungskerne „kleiner“ sind als die Feature Maps, häufig ver- 
wendete Größen sind 3 x 3 oder 7 x 7, reagiert jedes Neuron der Schicht 
l+ 1 nur auf einen kleinen Bereich der Feature Map der vorausgehenden 
Schicht. Deshalb spricht man von einem lokalen Sichtfeld oder lokalen Ver- 
bindungen (engl. local receptive field). Es sind also nicht alle Neuronen einer 
Schicht mit allen anderen verbunden. Benachbarte Neuronen innerhalb 
einer Feature Map werden aus überlappenden Bereichen der Vorgänger- 
schicht berechnet. Alle Neuronen einer Feature Map teilen sich dieselben 
Parameter (denselben Filter). Das ist bei vollständig verbundenen Netzen 
anders. Die kleinen Filterkerne und die gemeinsam genutzten Gewichte 
haben zur Folge, dass pro Schicht weniger Parameter trainiert werden müs- 
sen und deshalb tiefere Netzarchitekturen, also mehr Schichten, möglich 
sind als bei vollständig verbundenen Architekturen [HJ17]. 


3.2.2.2 Pooling-Schichten 


Pooling-Schichten werden oft im Wechsel mit Faltungsschichten eingesetzt. 
Beim Pooling (dt. Bündelung, Zusammenfassung) wird jede Feature Map 
separat behandelt. Die Anzahl bleibt also unverändert. Ziel des Poolings 
ist es, die Größe einer Feature Map zu verringern. Dies wird durch das 
Zusammenfassen benachbarter Neuronen erreicht. Die Größe des Fens- 
ters, innerhalb dessen die Neuronen zusammengefasst werden, kann frei 
gewählt werden. Üblich ist eine Fenstergröße von 2 x 2 und eine der Fens- 
tergröße entsprechenden Schrittweite, mit der das Pooling-Fenster über die 
Eingangsdaten „geschoben“ wird. Es gibt verschiedene Möglichkeiten, die 
Neuronen innerhalb des Fensters zusammenzufassen: Beim Average Poo- 
ling wird die durchschnittliche Aktivierung verwendet, beim Max Pooling 
wird die größte vorhandene Aktivierung übernommen. Letzteres hat sich 
gegenüber anderen Pooling-Methoden als vorteilhaft erwiesen [SMB10]. 
Eine weitere Möglichkeit ist es, keine separaten Pooling-Schichten zu ver- 
wenden, sondern stattdessen ebenfalls Faltungsschichten einzusetzen. In 
diesem Fall verwendet man Filter größerer Schrittweite, damit die Faltung 
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nicht auf jedes, sondern z.B. bei einer Schrittweite von 2 nur auf jedes 
zweite Neuron angewendet wird [Spr+15]. 

Die Verwendung von Pooling hat mehrere Gründe. Zum einen wird 
das neuronale Netz so robuster gegenüber kleinen Positionsänderungen 
der Merkmale innerhalb des Eingangsbildes [LKF10]. Außerdem reduziert 
sich der Rechenaufwand, weil die Anzahl der Neuronen verringert wird. 
Zusätzlich wird durch Pooling das lokale Sichtfeld tieferer Schichten ver- 
größert. 


Mit einem CNN können komplexe Merkmale des Eingangsbildes durch 
die Kombination einfacher Merkmale extrahiert werden. In der ersten 
Schicht werden nur einfache Merkmale, z.B. Kanten, detektiert. In der 
darauffolgenden Schicht werden diese Merkmalsextraktoren zusammen- 
gesetzt und dadurch werden komplexere Strukturen detektierbar [Arr+16]. 
Außerdem vergrößert sich der für die Neuronen sichtbare Bildbereich mit 
jeder Faltung und jeder Pooling-Operation. Je tiefer eine Schicht also im 
neuronalen Netz liegt, desto komplexer sind die dort erkennbaren Muster 
und desto größer ist das Sichtfeld der Neuronen. Für weitere Informatio- 
nen über CNNs sei auf die Arbeit von LeCun et al. [LBH15] verwiesen. 


3.2.3 Implementierungsdetails 


Im Folgenden wird auf Details und Begriffe eingegangen, die zum Ver- 
ständnis der in Kapitel 5 beschriebenen CNN-Architekturen beitragen. 


Zero Padding Um bei der Faltung eine unerwünschte Verkleinerung der 
räumlichen Dimension zu vermeiden, wie sie in Abbildung 3.4(a) auftritt, 
wird sogenanntes Zero Padding eingesetzt. Der Rand des Eingangstensors 
wird so mit Nullen aufgefüllt, dass die Größe vor und nach der Faltung 
dieselbe ist [DV18]. 


Vektorisierung, Global Average Pooling Auf die Faltungs- und Pooling- 
Schichten, die Merkmale aus den Eingangsdaten extrahieren, folgen nor- 
malerweise mehrere vollstandig verbundene Schichten. Diese ordnen die 
extrahierten Merkmale verschiedenen Ausgangen zu. Lange war es tiblich, 
die Feature Maps der letzten Faltungsschicht dafiir zu vektorisieren (engl. 
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flattening) und anschließend an die vollständig verbundenen Schichten zu 
übergeben. Ein großer Nachteil dieses Ansatzes ist die enorme zusätzliche 
Anzahl zu trainierender Modellparameter und das damit verbundene Risi- 
ko der Überanpassung. Dieses Problem kann mit Global Average Pooling 
(GAP) umgangen werden: Anstatt alle Neuronen aller Feature Maps zu 
erhalten, wird für jede Feature Map nur die durchschnittliche Aktivierung 
berechnet. Die gesamte Feature Map wird also auf ein einziges Neuron 
reduziert. Dieses kann anschließend direkt einer Kategorie zugeordnet 
oder an vollständig verbundene Schichten übergeben werden. Zusätz- 
lich zur Reduktion des Überanpassungsrisikos wird das Modell durch 
GAP robuster gegenüber räumlichen Translationen des Eingangsbildes 
[LCY14]. 


Gradientenverfahren und Rückwärts-Propagation Beim Training neuro- 
naler Netze geht es, analog zu allen anderen Modellen des tiberwachten 
maschinellen Lernens, darum, die Differenz zwischen dem Label und dem 
Output des Modells zu minimieren. Dafür muss zunächst eine Verlust- 
funktion E definiert werden (siehe Abschnitt 3.1.2). Diese wird während 
des Modelltrainings durch die Optimierung der Modellparameter mini- 
miert. Als Optimierungsverfahren wird bei neuronalen Netzen meist ein 
stochastisches Gradientenverfahren (engl. stochastic gradient descent, SGD) 
eingesetzt [LKF10]. 

Bei Gradientenverfahren wird der Einfluss kleiner Modellparameterän- 
derungen auf die Verlustfunktion betrachtet. Dieser Einfluss wird durch 
den Gradienten der Verlustfunktion in Abhängigkeit der Modellparameter 
W quantifiziert. Im einfachsten Fall werden die Modellparameter iterativ 
mit einer konstanten Lernrate A > 0 angepasst [LeC+98]: 


OE(W) 
Ow ` 
Anstatt den Gradienten basierend auf dem gesamten Trainingsdatensatz 
zu berechnen, wird er beim SGD-Verfahren oft nur auf Basis einer Teilmen- 
ge (einem sogenannten Mini-Batch) berechnet. Normalerweise führt diese 
Methode zu einer schnelleren Konvergenz [LeC+98]. Gradientenverfahren 
werden schon seit Jahrzehnten verwendet, waren jedoch zumeist auf li- 
neare Modelle limitiert [DHS00]. Dass dieses einfache Verfahren für das 
Training komplexer ML-Modelle geeignet ist, hat zwei Gründe [LeC+98]: 


Wk — Wki = A (3.15) 
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Erstens scheint die Anwesenheit lokaler Minima in der Verlustfunktion 
in der Praxis kein großes Problem zu sein. Zweitens existiert mit der 
Rückwärts-Propagation (engl. backward propagation) des Fehlers eine einfa- 
che und recheneffiziente Methode zur Berechnung des Gradienten in nicht 
linearen, aus mehreren Schichten bestehenden Systemen. Diese wurde 
1986 von Rumelhart et al. [RHW86] beschrieben und wird noch heute ver- 
wendet. Verschiedene Methoden für ein effektives Modelltraining werden 
von LeCun et al. [LeC+12] diskutiert. Der in dieser Arbeit verwendete 
Adam-Optimierer [BK15] ist eine Weiterentwicklung des SGD-Verfahrens. 


Batch-Normalisierung Das Training eines neuronalen Netzes wird durch 
die Tatsache erschwert, dass jede Schicht durch die Parameter aller vorher- 
gehenden Schichten beeinflusst wird. Während des Trainings verändern 
sich die Parameter und damit auch die Häufigkeitsverteilung der Ein- 
gangswerte einer Schicht. Das ist problematisch, weil sich die Schicht 
dann immer wieder an diese neue Verteilung anpassen muss. Je tiefer ein 
Netz ist, desto größer ist dieses Problem, weil selbst kleine Änderungen 
bei der Propagation durch viele Schichten verstärkt werden und zu si- 
gnifikanten Anderungen in tieferen Schichten führen können. Ioffe und 
Szegedy [IS15] entwickelten die Batch-Normalisierung (BN) mit dem Ziel, 
diesen Fffekt abzuschwächen. Da das stochastische Gradientenverfahren 
zumeist auf Teilmengen (den Mini-Batches) angewendet wird, wird hier 
analog vorgegangen. Der Mittelwert jig.:.n und die Standardabweichung 
TBatch des Batches werden für jedes Neuron berechnet. Anschließend wird 
die Aktivierung des Neurons damit normalisiert, mit einem Parameter x 
multipliziert und zum Schluss wird ein Parameter ¢ addiert: 


= Qi — HBatch J $ i (3.16) 
TBatch 


a; 
Batch-Normalisierung fiihrt zu einer Haufigkeitsverteilung der Eingangs- 
werte mit dem Mittelwert ¢ und der Standardabweichung x. ¢ und x 
zählen zu den Modellparametern und werden während des Trainingspro- 
zesses optimiert. Nach dem Training werden pgatch und Opatcn auf einen 
festen Wert gesetzt. Durch die Anwendung von BN-Schichten im Training 
müssen sich tiefere Schichten weniger an Veränderungen in davor liegen- 
den Schichten anpassen, es kann eine höhere Lernrate gewählt werden, die 
Trainingszeit verringert sich und die Abhängigkeit des Trainingsprozesses 
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von der Initialisierung sinkt [IS15]. Batch-Normalisierung wird sehr häufig 
eingesetzt, auch wenn noch nicht alle zugrunde liegenden Mechanismen 
verstanden sind [San+19]. 


Dropout Wird ein tiefes neuronales Netz mit wenigen Beispielen trai- 
niert, kommt es häufig zu einer Überanpassung an die Trainingsdaten und 
einer daraus resultierenden schlechten Modellgüte auf den Validierungs- 
und Testdaten. Dropout ist eine Regularisierungsmethode, mit der die 
Überanpassung verringert werden kann. Dabei werden während des Trai- 
ningsprozesses zufällig ausgewählte Neuronen weggelassen, beispielswei- 
se 50 %. Dies führt dazu, dass eher allgemein hilfreiche als sehr spezifische 
Merkmale erlernt werden und das Modell besser generalisiert [Hin+12]. 


3.2.4 Highway-Schicht 
In einer Highway-Schicht wird die Formel (3.10) erweitert zu [SGS15]: 


l 
al Ta Aisi (a, Wiis) Th ati ia, Wri) 


T a O (a = TH (a, Wr,,,,)) . 


a), gD, Fiala, Wu, 14) und T, (a, Wr, „„,) müssen diesel- 
be Dimension haben. T wird als Transfergate, 1 — T als Carrygate be- 
zeichnet. Multiplikation, Addition und Subtraktion erfolgen elementwei- 
se. In Abbildung 3.5 ist anschaulich gezeigt, was die Formel bedeutet. 
Der Name Highway kommt daher, dass der Ausgang der Schicht gerade 


(3.17) 


dem Eingang entspricht, wenn T; 1+1 (a, Wr, ,,,) = 0. Dann entsteht ein 
Informations-Highway, der die Eingangs-Information unverändert an die 
nächste Schicht weitergibt. Falls T, +1 (a, Wr, ,,,) = List, entspricht die 
Transformation wieder Formel (3.10). In Abhangigkeit des Transfergates 
verändert also die ganze Schicht ihr Verhalten. In dieser Arbeit wird ein 
Autoencoder mit mehreren Highway-Schichten zur Korrektur von Feh- 
lern in den Rautiefenmesswerten verwendet. Dies ist in Abschnitt 4.3.1 
detailliert beschrieben. 
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Informations-Highway 


Abbildung 3.5 Architektur einer Highway-Schicht, die ihr Verhalten in Abhängigkeit des 
Transfergates T; ;}ı verändert. 


3.2.5 Anwendungen neuronaler Netze in der Fertigung 


Fertigungsprozesse sind in den letzten Jahren automatisierter, compute- 
risierter und komplexer geworden. Es entsteht die neue Form der intel- 
ligenten Fertigung, welche eine weitere industrielle Revolution einleitet 
[Kus18]. Dabei kommen zunehmend auch datenbasierte Methoden des 
maschinellen Lernens zum Einsatz. Kusiak [Kus18] schrieb 2018: „We are 
witnessing the renaissance of data in manufacturing. (...) It will be the best 
source for preserving and extraction of past and new knowledge related 
to manufacturing.” 

Methoden des maschinellen Lernens werden bereits in verschiedensten 
Bereichen der Fertigung eingesetzt, unter anderem zur Prozessoptimie- 
rung, -überwachung und -regelung und zur vorausschauenden Wartung 
(engl. predictive maintenance) [Wue+16]. Je nach Problemstellung und den 
zur Verfügung stehenden Daten werden verschiedene Modellansätze ver- 
wendet. Die in Abschnitt 3.2.2 eingeführten faltenden neuronalen Netze 
finden breite Anwendung bei der Prozessüberwachung. Sie eignen sich 
hervorragend zur Detektion, Lokalisierung und Klassifizierung von Defek- 
ten in verschiedensten Produktionsprozessen. Im Gegensatz zu anderen 
Detektionsmethoden, die auf manuell designten Merkmalen beruhen, ler- 
nen die Netze während des Trainings, relevante Merkmale zu extrahieren 
und den Defekt darauf basierend zu klassifizieren. 
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3.2.5.1 Anwendungsbeispiele von CNNs im Fertigungskontext 


CNNs wurden bereits eingesetzt, um LED-Chips auf zwei Defektarten (Li- 
nienfehler, Kratzer) hin zu untersuchen [Lin+19]. Als Eingangsinformation 
für das CNN diente ein Graustufenbild des Chips. Es konnte eine Klassi- 
fikationsgenauigkeit von 95 % erzielt werden. Nur in wenigen Arbeiten 
wird über die Detektion und Klassifikation hinaus versucht, die Ursache 
für den Defekt zu finden. Ein Beispiel dafür ist die Arbeit von Lee et al. 
[LCK17], die den Einsatz eines CNNs für die Fehlerklassifizierung und 
-diagnose in der Halbleiterherstellung thematisiert. Dem CNN wurden 
keine Bilder präsentiert, sondern eine zweidimensionale Matrix verschie- 
dener zeitabhängiger Sensorsignale. Auf einer Achse war die Zeit, auf 
der anderen waren die unterschiedlichen Sensorsignale aufgetragen. Das 
Sichtfeld des CNNs bewegte sich nur entlang der Zeitachse. Zusätzlich 
zur Detektion eines Fehlers wurde das für die Entscheidung des CNNs 
wichtigste Sensorsignal und damit indirekt die Fehlerursache identifiziert. 
Dies geschah durch die Betrachtung der Gewichte zwischen der Eingangs- 
und der ersten verdeckten Schicht in Kombination mit den Aktivierungen. 
Der verwendete Datensatz beinhaltete 6000 fehlerfreie und gleich viele 
fehlerbehaftete Beispiele. Die Modellgüte unterschied sich für verschiede- 
ne Fehlertypen, im Mittel konnte eine Klassifikationsgenauigkeit von 98 % 
erreicht werden. Neben der Erkennung von Defekten werden neuronale 
Netze auch vermehrt zur kontaktlosen Bestimmung von Oberflächenkenn- 
größen, z.B. der Rautiefe, eingesetzt. Sun et al. [Sun+18] bestimmten die 
Rauheit von gefrästen Oberflächen mithilfe eines CNNs nach einer auf- 
wendigen Schräglagenkorrektur und Filterung der aufgenommenen Bilder. 
Die für das Training des Modells benötigten Labels wurden durch eine 
Tastspitzenmessung ermittelt. Der Datensatz bestand aus 2040 Bildern, die 
mittlere Korrektklassifikationsrate betrug 95 %. 

Andere Anwendungsbereiche von CNNs in der Fertigung sind die Prä- 
diktion der verbleibenden Nutzungsdauer, z. B. von Turbofantriebwerken 
[SZL16] und die Zustandsüberwachung, z. B. von Getriebezähnen [KC19]. 
In beiden Fällen wurden Sensorsignale als Eingangsinformation für die 
neuronalen Netze verwendet. Bei Sateesh Babu et al. [SZL16] waren es die 
Zeitreihen von 21 Sensoren, die von Wang et al. [WYH12] näher beschrie- 
ben wurden. [KC19] betrachten zwei Zeitreihen-Signaltypen, Vibrationen 
und den sogenannten Übertragungsfehler des jeweiligen Getriebes. 


56 


3.2 Künstliche neuronale Netze 


3.2.5.2 Anwendungsbeispiele von CNNs im Kontext der 
Lasermaterialbearbeitung 


Im Kontext der Lasermaterialbearbeitung werden CNNs bislang vor al- 
lem zur Überwachung des Schweißprozesses eingesetzt. Ein Bild der 
Schweifsnaht wird an das Netz übergeben und hinsichtlich verschiedener 
Qualitätskriterien klassifiziert. Bei Khumaidi et al. [KYP17] waren das 
die Klassen: gute Qualität, verspritzt, porös und Hinterschnitt. Sizyakin 
et al. [Siz+19] betrachteten Risse, Poren, Einschlüsse, eine fehlende Ver- 
schweißung und Verformungen. Während Khumaidi et al. [KYP17] eine 
experimentelle Datenbasis bestehend aus 120 Schweißnähten für ihr Mo- 
delltraining und die Evaluierung verwendeten, erfolgte das Training bei 
Sizyakin et al. [Siz+19] auf der öffentlich verfügbaren Datenbasis GDXray 
[Mer+15], die 88 Röntgenbilder von Schweißverbindungen enthält. Eine 
Online-Methode zur Defektdetektion mit CNNs beim Schweißen wurde 
von Zhang et al. [ZWC19] vorgeschlagen. 

Stahl und Jauch [SJ19] veröffentlichten eine Arbeit zur bildbasierten 
Bestimmung der Rauheit einer Laserschnittkante mit einem CNN, ähnlich 
dem in Abschnitt 6.2.2 beschriebenen Ansatz. Sie übergaben ein Bild einer 
Laserschnittkante an ein CNN und schätzten die Rauheit. Ihr Ansatz hat 
jedoch die folgenden Schwächen: Zum einen wurde die gesamte Kante 
durch einen gemittelten Rauheitswert beschrieben, welcher wenig aussa- 
gekräftig ist, da Laserschnittkanten oft mehrere Schichten verschiedener 
Rauheit aufweisen. Außerdem haben die Autoren einen Fehler bei der 
Aufteilung in Trainings- und Testdaten gemacht: Zu jeder Schnittkante 
gibt es fünf Bilder, die sehr ähnlich aussehen, da die gesamte Kante mit 
denselben Prozessparametern geschnitten wurde. Die Anzahl der Bilder 
wurde außerdem durch Spiegeln an der vertikalen Achse weiter erhöht. 
Anschließend wurden die Bilder zufällig den Trainings- oder Testdaten zu- 
geordnet, weshalb davon auszugehen ist, dass die Schätzung der Rauheit 
durch das CNN nur deshalb so gut gelang, weil es die Schnittkanten aus 
dem Training im Test wiedererkannt hat. Beim dem von Stahl und Jauch 
[SJ19] verwendeten CNN handelte es sich um ein modifiziertes AlexNet 
[KSH17], welches viel mehr Parameter aufweist als das in dieser Arbeit 
verwendete Modell. Die Datenbasis bestand aus 100 Teilen. 

Eine ganz andere und bislang wenig eingesetzte Anwendung stellt 
die Prädiktion des Prozessresultats mithilfe eines CNNs dar, wie sie von 
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Gongalves et al. [GSP20] publiziert wurde. Die Autoren schätzten die finale 
Schmelzperlengeometrie beim Laserstrahl-Auftragschweißen (engl. laser 
cladding). Bei dieser Fertigungstechnik wird ein Volumenaufbau durch ein 
Schweißzusatzpulver realisiert. Als Eingangsinformation für das CNN 
diente ein Bild des Schmelzbades, das koaxial zum Laserstrahl aufgenom- 
men wurde. Es wurde ergänzt durch verschiedene Prozessparameter. Am 
Ausgang des Netzes wurden die Breite und Höhe der zu erwartenden 
Schmelzperle geschätzt. Goncalves et al. [GSP20] verglichen sechs CNNs, 
die sich hinsichtlich ihrer Anzahl der Faltungs- und der vollständig ver- 
bundenen Schichten unterschieden. Am besten schnitt ein Netz mit fünf 
Faltungs- und einer vollständig verbundenen Schicht ab. Als Datengrund- 
lage dienten 72 Schmelzperlen. 


3.2.6 Interpretierbarkeit neuronaler Netze 


Dank der zunehmenden Verfügbarkeit großer Datenmengen, Verbesse- 
rungen der Methodik und immer mehr Rechenkapazität konnten mit 
komplexen ML-Modellen (vor allem mit künstlichen neuronalen Netzen) 
in verschiedensten Bereichen Ergebnisse erzielt werden, die bestehende 
Lösungen und/oder die Leistungsfähigkeit des Menschen übertreffen. Ein 
Problem ist jedoch, dass neuronale Netze aufgrund ihrer verschachtelten, 
nicht linearen Struktur als sogenannte Black Boxes gelten, deren inneres 
Verhalten unbekannt ist. Es gibt viele Gründe, warum diese mangelnde 
Transparenz problematisch und die Interpretierbarkeit komplexer Modelle 
wünschenswert oder sogar notwendig ist. 

Zum einen lässt sich so erkennen, wenn ein neuronales Netz „falsche“ 
Zusammenhänge erlernt hat, die jedoch zu richtigen Klassifikationen 
führen. Beispielsweise wurden Pferde im PASCAL VOC 2007 Daten- 
satz [Eve+10] sehr zuverlässig erkannt, was jedoch an den Copyright- 
Hinweisen lag, die nur diese Bilder enthielten [Lap+19]. Sobald diese 
entfernt wurden, konnten Pferde nicht mehr korrekt klassifiziert werden. 

Des Weiteren sind Visualisierungen und Erklärungen des Verhaltens 
neuronaler Netze wichtig, um das Vertrauen in die Technologie zu stärken. 
Die Erklärung von Entscheidungen ist ein zentraler Bestandteil zwischen- 
menschlicher Interaktion und sollte deshalb auch für Mensch-Maschine- 
Interaktionen gelten [Ant+12]. Dies betrifft insbesondere Systeme, die 
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Menschen unterstützen sollen und sicherheitsrelevante Anwendungen 
wie das autonome Fahren. 

Die Erklärbarkeit von Modellentscheidungen ist außerdem wichtig für 
die Klärung rechtlicher und ethischer Fragen, beispielsweise nach der 
Haftung oder nach diskriminierenden Elementen [SM19]. 

Der letzte und im Kontext dieser Arbeit wichtigste Grund, Transparenz 
zu fordern, ist, dass Einblicke in die Modelle die Grundvoraussetzung 
für neue Erkenntnisse sind. KI-basierte Modelle sind in der Lage, Muster, 
Strukturen und Regeln in Daten zu erkennen, die bisher gar nicht bekannt 
waren. Samek und Müller [SM19] schreiben, dass die so erlangten neuen 
Erkenntnisse in der Wissenschaft oft wichtiger sind als die Vorhersage 
selbst. In der Vergangenheit wurden deshalb oft einfache, leicht interpre- 
tierbare Modelle eingesetzt. Neue Möglichkeiten, komplexe Modelle zu 
visualisieren, eröffnen ganz neue Perspektiven. 

In den vergangenen Jahren wurde aus den oben genannten Gründen 
vermehrt an Ansätzen zur Erklärbarkeit und Visualisierung künstlicher 
neuronaler Netze geforscht. Für einen ersten Überblick ist es sinnvoll, be- 
stehende Ansätze, wie von Samek und Müller [SM19] vorgeschlagen, nach 
ihrem Informationsgehalt und nach der zugrunde liegenden Methodik zu 
unterscheiden. Es handelt sich nicht um einen vollständigen Überblick, 
sondern um eine kurze Zusammenstellung wichtiger Methoden. 


3.2.6.1 Visualisierungsmethoden nach ihrem Informationsgehalt 


Erklärung der erlernten Repräsentationen Bei diesem Ansatz geht es 
darum, die von einem trainierten Netz erlernten Muster zu verstehen. 
Dabei werden zum Beispiel einzelne Neuronen oder Gruppen mehrerer 
Neuronen betrachtet [Bau+17]. Eine andere Herangehensweise ist die 
Berechnung eines Prototyps, der für ein bestimmtes erlerntes Konzept 
repräsentativ ist [SVZ14]. 


Erklärung einzelner Vorhersagen Durch die Visualisierung der für die 
jeweilige Entscheidung des Netzes wichtigsten Pixel ausgewählter Ein- 
gangsbilder in einer Heatmap kann ein neuronales Netz validiert werden 
[MSM18]. Dadurch kann außerdem das Vertrauen in seine Funktionalität 
erhöht werden und es können neue Muster oder Strategien identifiziert 
und neue wissenschaftliche Erkenntnisse gewonnen werden. Zu diesen 
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Techniken zählt unter anderem die in dieser Arbeit eingesetzte Layer-wise 
Relevance Propagation (siehe Abschnitt 5.2). 


Erklärung des Modellverhaltens Dieser Ansatz geht über die Erklärung 
einzelner Vorhersagen hinaus und versucht, das Modellverhalten, bei- 
spielsweise die angewandten Strategien, besser zu verstehen. Lapuschkin 
et al. [Lap+19] generieren diese Information durch das Clustern mehrerer 
einzelner Vorhersagen und der zugehörigen Heatmaps. 


Erklärung mithilfe repräsentativer Beispiele Hierbei geht es darum, den 
Trainingsdatensatz und dessen Einfluss auf das neuronale Netz besser 
zu verstehen. Dazu werden repräsentative Trainingsbeispiele identifiziert 
und analysiert [KL17]. 


3.2.6.2 Visualisierungsmethoden nach der zugrunde liegenden 
Methodik 


Stellvertreter-Modelle (engl. surrogates) Da einfache (z.B. lineare) Mo- 
delle leicht zu interpretieren sind, werden komplexe Modelle lokal mit 
einer einfachen Funktion approximiert. Ein bekanntes Beispiel dafür ist 
die LIME-Methode (engl. local interpretable model-agnostic explanations) 
[RSG16]. 


Lokale Störungen (engl. local perturbations) Ein Modell wird erklärt, 
indem seine Reaktionen auf lokale Änderungen untersucht werden. Es ist 
jedoch zu beachten, dass damit weniger die Vorhersage selbst, sondern nur 
Änderungen der Vorhersage erklärt werden können. Das berühmteste und 
älteste Beispiel ist die Sensitivitätsanalyse [Mor+95]. Diese wird aufgrund 
verschiedenster Probleme als ungeeignet für die Erklärung heutiger ML- 
Modelle angesehen [MSM18]. Verwandt damit sind Methoden, die das 
Modellverhalten in Abhängigkeit allgemeinerer Störungen untersuchen. 
Bei der Okklusionsmethode [ZF14] wird beispielsweise ein Teil des Ein- 
gangsbildes abgedeckt. Die oben bereits erwähnten Prototyp-Methoden 
fallen ebenfalls in diese Kategorie. Der Prototyp einer Klasse ist der Input, 
der die maximale Antwort des Modells bei dieser Klasse hervorruft. Die 


60 


3.2 Künstliche neuronale Netze 


Erklärung des Modells wird in diesem Fall als Optimierungsproblem be- 
trachtet. Prototypen für Kategorien von Alltagsobjekten, denen mithilfe 
eines CNNs Bilder zugeordnet wurden, zeigten Simonyan et al. [SVZ14]. 


Propagationsbasiert Propagationsbasierte Ansätze integrieren die Mo- 
dellstruktur in den Erklärungsprozess. Bei der in dieser Arbeit verwen- 
deten LRP-Technik wird die Modellstruktur zusammen mit geeigneten 
Propagationsregeln verwendet, um zu berechnen, wie groß der Einfluss 
jedes Eingangsmerkmals auf die Modellvorhersage war. Andere Metho- 
den dieser Kategorie sind Deconvolution [ZF14] und Guided Backpro- 
pagation [Spr+15]. Mittlerweile sind viele dieser Methoden mithilfe der 
Python-Bibliothek iNNvestigate [Alb+19] anwendbar. Zum Zeitpunkt der 
Implementierung der LRP im Rahmen dieser Arbeit war das noch nicht 
der Fall. 


Meta-Methoden Um allgemeine Strategien und Muster zu identifizieren, 
werden einzelne Erklärungen zusammenfasst und gemeinsam analysiert. 
Ein bekannter Vertreter der Meta-Methoden ist die SpRAy (engl. spectral 
relevance analysis) [Lap+19]). 


3.2.6.3 Anwendungen der Layer-wise Relevance Propagation 


Bei der Visualisierung neuronaler Netze gibt es nicht die eine immer pas- 
sende Methode. Stattdessen muss je nach Fragestellung, Modellarchitektur 
und Datengrundlage entschieden werden, welche Herangehensweise am 
besten geeignet ist. In dieser Arbeit wurden verschiedene Visualisierungs- 
methoden getestet. Neben der LRP waren das Regression Activation Maps 
[Zho+16] und Class Activation Maximization [SVZ14]. Letztere lieferten 
jedoch keine für den Menschen verständlichen Ergebnisse. Die Gründe 
dafür werden in Abschnitt 6.4.1 kurz thematisiert. 

Neben den Publikationen, in denen die Grundlagen der LRP erläutert 
und veranschaulicht werden, gibt es auch Arbeiten, die diese Visualisie- 
rungstechnik bereits in der Praxis anwenden. Eine davon wurde von Grez- 
mak et al. [Gre+20] publiziert. Als Eingangsdaten für das CNN dienten 
die in ein Bild überführten Vibrationssignale eines Asynchronmotors. Das 
CNN klassifizierte, ob der Motor in Ordnung war oder ob eines von drei 
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Problemen vorlag. Mithilfe der LRP konnte identifiziert werden, welcher 
Signalanteil für welchen Fehlertyp besonders relevant war. Außerdem 
konnte untersucht werden, inwieweit sich die relevanten Bereiche ver- 
schiedener, aber zum selben Fehlertyp gehörender Eingangsbilder unter- 
schieden und ob es Unterschiede bei verschiedenen CNN-Architekturen 
gab. Ein Beispiel aus einem anderen Bereich, der Medizin, wurde von 
Böhle et al. [Böh+19] veröffentlicht. Sie setzten die LRP ein, um die Ent- 
scheidungen eines CNNs zu erklären, das Anzeichen für Alzheimer in 
MRT-Bildern des Gehirns erkennt. Die Hirnareale, die in den Bildern an- 
hand der LRP als wichtig für die Entscheidung des CNNs identifiziert 
werden konnten, waren in anderen Arbeiten bereits als Hinweise auf 
Alzheimer beschrieben worden. 

In beiden Fällen wurde die Visualisierung genutzt, um neue Erkenntnis- 
se zu erzielen. Im ersten Beispiel ging es darum, diese Erkenntnisse für die 
Optimierung der Modelle zu nutzen. Im zweiten Beispiel unterstützte die 
LRP den Menschen bei einer Entscheidung. Ein Arzt oder eine Ärztin kann 
von einem neuronalen Netz, das Alzheimer erkennt, lernen, welche Bildbe- 
reiche besonders wichtig sind. Des Weiteren stärkt die Visualisierung das 
Vertrauen in ML-Modelle, weil die Entscheidung des Netzes begründet 
wird. In dieser Arbeit wird die LRP genutzt, um das Prozessverständnis zu 
erweitern und um bei Problemen zu unterstützen (siehe Abschnitt 6.4.1). 
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Als Grundlage für das Training der ML-Modelle wurde eine große Da- 
tenbasis erzeugt. Diese sollte möglichst viele unterschiedlich aussehende 
Schnittkanten enthalten und Wechselwirkungen der Prozessparameter 
abbilden. Deshalb wurden vier dominante Prozessparameter vollfaktoriell 
variiert und insgesamt 1126 Teile geschnitten, von denen bei 227 Teilen 
Fehlschnitte auftraten. Die anderen 899 Teile konnten aus dem Restgitter 
entnommen und weiter verwendet werden. Von jeder Kante dieser 899 
Teile wurden RGB-Bilder und 3D-Punktwolken aufgenommen. Aus den 
3D-Punktwolken konnten objektive Qualitätskriterien abgeleitet werden. 
Außerdem beurteilten fünf Experten die Qualität einiger Kanten subjektiv. 


4.1 Schneidexperiment 


Um möglichst viele verschiedene Schnittkanten zu erhalten, wurden vier 
Prozessparameter variiert. Ausgangspunkt für die Parametervariation war 
der Standardschneidprozess für Edelstahlbleche der Dicke 3mm auf einer 
TruLaser 5030 fiber (L68) Maschine. Diese ist mit einem Scheibenlaser der 
Wellenlänge 1030 nm ausgestattet, einem TruDisk 12001. Weitere Infor- 
mationen zur Maschine und zum Laser sind in Anhang A.1 zu finden. 


Von TRUMPF werden die in Tabelle 4.1 in der LTT-Spalte aufgelisteten 
Prozessparameter empfohlen. Ausgehend von den LTT-Werten wurden 
folgende Prozessparameter variiert: Abstand Düse-Blech (ADB), Einstell- 
maß (EM), Gasdruck und Vorschub. Die Stufen der Parametervariation 
sind in Tabelle 4.1 aufgelistet. Die Prozessparameter sind in Abbildung 
4.1(a) veranschaulicht. Beim ADB handelt es sich um den Abstand der Dü- 
senspitze von der Blechoberseite. Das Einstellmaß beschreibt den Abstand 
zwischen Düsenspitze und Strahlfokus. Befindet sich der Fokus unterhalb 
der Düse, ist das EM negativ, andernfalls hat es ein positives Vorzeichen. 
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Tabelle 4.1 LTT-Werte und Faktorstufen der wichtigsten Prozessparameter. 


Parameter Einheit Min. LIT Max. Schritt 


Abstand Düse-Blech mm 0,5 1,5 3,0 0,5 


Einstellmaß mm -35 20 05 0,5 
Gasdruck bar 9 15 21 3 
Vorschub m/min 13 21 29 4 
Fokusdurchmesser pm 150 

Laserleistung kW 8 


ay 
Qı 


Häufigkeit 
S 


-3 —2 -21 0 1 2 
Fokusposition in mm 


(a) Variierte Prozessparameter und FP. (b) Histogramm der Fokusposition. 


Abbildung 4.1 Die variierten Prozessparameter Abstand Düse-Blech (ADB), Einstellmaß 
(EM), Gasdruck und Vorschub werden durch die Fokusposition (FP), die Kombination von 
ADB und EM, ergänzt. 


Der Gasdruck ist der Druck des als Schneidgas verwendeten Stickstoffs. 
Der Schneidkopf bewegt sich mit der Vorschubgeschwindigkeit über das 
Blech, welches ruhig auf den Stegen der Palette aufliegt. 

Andere Parameter wurden vor allem aus praktischen Gründen nicht 
variiert. Die Stahlquelle wurde als gegeben angenommen und zugehörige 
Parameter, wie z. B. die Stahlqualität und die Laserleistung, wurden nicht 
verändert. Eine nicht konstante Laserleistung hätte die Kompensation ther- 
mischer Effekte in den Optiken (siehe Abschnitt 4.1.3) noch schwieriger 
gemacht, da deren Erwärmung von der Laserleistung abhängt. Aus dem- 
selben Grund wurde die sogenannte Analogwertsteuerung deaktiviert. 
Normalerweise reduziert diese die Laserleistung, sobald der Vorschub 
(z.B. an den Ecken) sinkt und verhindert so eine Veränderung der Schnitt- 
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qualitat und die Nichteinhaltung von Formtoleranzgrenzen. Da in dieser 
Arbeit nur der gerade Schnitt betrachtet wird, spielt dieser Effekt sowieso 
keine Rolle. Die beweglichen Optiken im Schneidkopf der TruLaser 5030 
fiber Maschine hatten eine kleinschrittige Anderung des Fokusdurchmes- 
sers ermöglicht. Da dies in vielen herkömmlichen Maschinen nicht der 
Fall ist, wurde aus Gründen der Übertragbarkeit darauf verzichtet. 

Aufgrund der vollfaktoriellen Variation hatte jeder weitere Parameter 
eine Vervielfachung der Parameterkombinationen bedeutet. Daher musste 
die Zahl der Parameter begrenzt, die Bandbreite der Variation beschrankt 
und die Schrittweite möglichst groß gewählt werden. Um sinnvolle Band- 
breiten zu wählen, wurden Vorversuche durchgeführt. Hierbei wurde je- 
weils einer der Parameter ausgehend von der LTT-Parameterkombination 
variiert. Bei einem Einstellmaß von -3,8mm kam es zu einem Fehlschnitt. 
Dasselbe passierte bei einem Vorschub von 30 m/min. Es wurde davon 
ausgegangen, dass das Fehlschnittrisiko durch die gleichzeitige Variation 
weiterer Parameter eher zunimmt. Deshalb wurde ein EM von -3,5 mm 
als Untergrenze und bezüglich des LTT-Werts symmetrisch dazu ein EM 
von -0,5mm als Obergrenze gewählt. Analog folgte für den Vorschub 
eine Bandbreite von 13 bis 29 m/min. Durch eine Variation des ADBs 
und des Gasdrucks konnte kein Fehlschnitt herbeigeführt werden, ohne 
dass gleichzeitig eine Gefährdung des Schneidkopfs durch Kollisionen 
oder Verschmutzungen ausgeschlossen werden konnte. Um Kollisionen 
zu vermeiden, darf die Düse nicht zu nah über die Blechoberfläche bewegt 
werden. Deshalb wurde ein ADB von 0,5mm als Untergrenze festgelegt. 
Der Gasdruck, der die Schmelze aus dem Schnittspalt austreibt, muss 
gleichzeitig die Optiken vor Spritzern schützen und darf deshalb nicht zu 
weit reduziert werden. Dies ist insbesondere wichtig, weil während des 
Schneidexperiments das stabile Prozessfenster verlassen wird und es bei 
Fehlschnitten zu starkem Spritzen kommen kann. Darum wurde, wie von 
erfahrenen Personen empfohlen, kein Gasdruck unter 9bar benutzt. 

Oft ist es sinnvoll, die oben beschriebenen vier Parameter durch die 
Fokusposition (FP) zu ergänzen. Diese beschreibt, wie in Abbildung 4.1(a) 
gezeigt, die Position des Strahlfokus bezogen auf die Blechoberseite. Sie 
ergibt sich aus der Summe von ADB und EM (unter Beachtung der Vor- 
zeichen). Befindet sich der Strahlfokus inner- oder unterhalb des Blechs, 
ist die Fokusposition negativ, andernfalls ist sie positiv. Da die vier Pro- 
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zessparameter ADB, EM, Gasdruck und Vorschub vollfaktoriell variiert 
wurden, liegt zu jeder Faktorstufe eines Parameters jede Kombination der 
anderen Parameter vor. Alle Faktorstufen eines Parameters treten gleich 
häufig auf. Dies trifft auf die Fokusposition nicht zu. Ihr Histogramm ist 
in Abbildung 4.1(b) dargestellt. Dass auch die Faktorstufen der anderen 
Parameter später in den Daten nicht mehr gleichverteilt sind, liegt an der 
Parameterabhänigkeit der Fehlschnitte (siehe dazu Abschnitt 6.1.1). Bei 
einem Fehlschnitt kann das Blech nicht getrennt und das Teil nicht aus 
dem Restgitter entnommen werden. 

Die vollfaktorielle Variation der vier Prozessparameter (mit sechs, sie- 
ben, fünf und fünf Faktorstufen, siehe Tabelle 4.1) ergab 1050 verschie- 
dene Kombinationen. Jede wurde verwendet, um ein Teil zu schneiden. 
Zusätzlich wurden 5 % zufällig ausgewählte Kombinationen wiederholt. 
Diese 53 Kombinationen wurden an zufälligen Stellen in den Versuchs- 
plan integriert. Die LTT-Parameterkombination wurde anschließend alle 
50 Teile (Teil 0001, 0051, 0101...) eingefügt. Damit konnte schon während 
des Schneidversuchs überprüft werden, ob sich eine der nicht erfassten 
Einflussgrößen verändert hatte. RGB-Bilder aller LTT-Teile sind in Anhang 
A.2 abgebildet. Der für das Schneidexperiment verwendete Versuchsplan 
enthielt damit insgesamt 1050 + 53 + 23 = 1126 Parameterkombinationen, 
von denen 1050 verschieden waren. 


4.1.1 Probe 


Jede Parameterkombination wurde verwendet, um ein Quadrat mit einer 
Seitenlänge von 10cm zu schneiden. Betrachtet werden von jeder Kante 
nur die mittleren 5cm, weil nur dort garantiert werden kann, dass alle 
Prozessparameter konstant waren und der eingestellte Vorschub vorlag. 
Jedes Teil kann über einen mit dem Laser aufgebrachten Data Matrix Code 
(DMC) identifiziert werden. Dieser codiert die verwendete Maschine, den 
Versuchsplan, welcher alle Parameterkombinationen enthält, sowie die 
Blechdicke und die Nummer des Teils. Für alle in dieser Arbeit betrachte- 
ten Teile lautet die Identifikationsnummer A2231E0009-KHtQXc5p3D-030-, 
da sie alle auf derselben Maschine (A2231E0009), mit einem Versuchsplan 
(KHtOXc5p3D) und in einer Blechdicke (3 mm) hergestellt wurden. Sie un- 
terscheiden sich nur in den letzten vier Ziffern, der Teilenummer von 0001 
bis 1126. Deshalb wird im Folgenden zur besseren Lesbarkeit lediglich 
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0300 


0550 0275 


T 


0252 


0251 
0526 Y 0276 
(a) Probe und Benennung der vier Kanten. (b) Anordnung der Teile 0251 bis 0550 auf der 
Uber den aufgebrachten DMC ist jedes Teil zweiten Blechtafel in 25 Reihen (in x-Richtung 
identifizierbar. Die quadratische Kontur in der der Maschine) und 12 Spalten (in y-Richtung 
Mitte des Teils wird für die Temperaturkom- der Maschine). 


pensation (siehe Abschnitt 4.1.3) benötigt und 
spielt im weiteren Verlauf keine Rolle. 


Abbildung 4.2 Probe und Anordnung der Proben auf einer Blechtafel. 


diese Nummer zur Identifikation verwendet. Die Kanten des Quadrats 
werden nummeriert von 1 bis 4, beginnend auf der dem DMC gegen- 
überliegenden Kante und dann aufsteigend im Uhrzeigersinn. Dies ist in 
Abbildung 4.2(a) zusammengefasst. Auf eine Kante wird mit der Identi- 
fikationsnummer des Teils ergänzt durch die Kantennummer verwiesen. 
Die Nummer 0001-2 verweist beispielsweise auf die Kante 2 des Teils 0001. 


4.1.2 Material und Schachtelung 


Das verwendete Material war 3mm dicker Edelstahl mit der Werkstoff- 
nummer 1.4301. Die Bleche wurden kaltgewalzt und entsprachen den 
Normvorgaben nach DIN EN ISO 9445 [Deu10b], die Schwankungen der 
Dicke von bis zu +0,16 mm erlaubt. Im schlechtesten Fall ergibt sich al- 
so eine Differenz von 0,32 mm zwischen der dünnsten und der dicksten 
Stelle des Blechs, was 10 % der Blechdicke entspricht. Weitere Merkmale 
des Blechs, z.B. chemische und mechanische Eigenschaften, entsprachen 
Vorgaben nach DIN EN 10088-2 [Deu14] und -4 [Deul0a] sowie DIN EN 
10028-7 [Deu16]. 
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Ein Blech hatte eine Länge von 300 cm und eine Breite von 150 cm und 
passte damit genau auf die Palette der Maschine (siehe Abschnitt 2.1.3). 
Die Quadrate wurden in 25 Reihen und 12 Spalten, wie in Abbildung 4.2(b) 
gezeigt, auf das Blech geschachtelt. Insgesamt waren vier Blechtafeln nötig. 
Alle entstammten derselben Charge. Die Teile 0001 bis 0250 wurden aus 
den Spalten 3 bis 12 der ersten Tafel geschnitten, die Teile 0251 bis 0550 
aus der zweiten, die Teile 0551 bis 0850 aus der dritten und die Teile 0851 
bis 1126 aus der vierten Tafel. Die Kanten 1 und 3 verliefen stets parallel 
zur y-Achse der Maschine, die Kanten 2 und 4 orthogonal dazu und damit 
parallel zur x-Achse. Mithilfe variabler Abstände zwischen den Teilen in 
x-Richtung wurde vermieden, dass die Kanten 1 oder 3 direkt über den 
Stegspitzen verliefen, da dies den Schneidprozess beeinflusst hätte. Ein 
Mindestabstand von 15mm zwischen zwei Teilen und zum Blechrand 
wurde nie unterschritten. Dass die Kanten 2 und 4 an einzelnen Stellen 
auf einer Stegspitze auflagen, ließ sich nicht vermeiden. 


4.1.3 Überwachung des Maschinenzustands 


Während der mehrtägigen Abarbeitung des Versuchsplans wurde die Ma- 
schine mit einem hohen personellen und zeitlichen Aufwand überprüft 
und überwacht. Im normalen Produktionsumfeld ist das nicht möglich. 
Für diese Arbeit war es jedoch nötig, um erstens zu garantieren, dass 
sich der Maschinenzustand nicht verändert und es keinen Einfluss hat 
zu welchem Zeitpunkt ein Teil geschnitten wurde, um zweitens die Über- 
tragbarkeit auf andere Maschinen sicherzustellen und um drittens zu ge- 
währleisten, dass die eingestellten Soll- den tatsächlichen Ist-Parametern 
entsprechen. 

Vor Beginn des Schneidexperiments wurden der Laser und die Maschine 
ausführlich überprüft und gewartet. Die Maschine wurde gereinigt und 
mit Schlacke verschmutzte oder beschädigte Stege wurden getauscht. 

Sobald man den Laserstrahl ein- oder ausschaltet und sich die Optiken 
im Schneidkopf erwärmen oder abkühlen, verschiebt sich die Position 
des Strahlfokus entlang der Strahlachse wegen des thermisch induzierten 
Fokusshifts [SM10]. Dieser wird durch Temperaturänderungen in den 
Optiken verursacht, weil der Brechungsindex von der Temperatur und 
von mechanischen Spannungen abhängt [SM10]. Es wurde vorab gemes- 
sen, wie sich die Fokusposition in Abhängigkeit von der Einschaltzeit 
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des Laserstrahls verschiebt. Dafür wurde unterhalb des Schneidkopfs ein 
BeamWatch-Messgerat der Firma Ophir Photonics platziert, das die Strahl- 
kaustik über die Rayleigh-Streuung erfasst. In Abbildung 4.3(a) ist der 
Extremfall für einen ab dem Zeitpunkt Os dauerhaft eingeschalteten Strahl 
gezeigt. Als Bezugswert dient die Fokusposition einer kalten Maschine. 
In den ersten 10s verschiebt sich der Fokus um ca. 170 um. Nach 60 s hat 
er sich um ca. 310 um gegenüber der Ausgangsposition bewegt. Dies ist 
bei den gewählten Schrittweiten von 0,5 mm für ADB und EM durch- 
aus relevant und für die Modellierung der Zusammenhänge zwischen 
Fokusposition und Schnittkante äußerst hinderlich. Damit sichergestellt 
werden konnte, dass die eingestellte Soll- der Ist-Fokusposition entspricht, 
wurde dieser thermische Effekt kompensiert. Mit einer solchen Technik 
sind Laserschneidmaschinen mit Festkörperlaserquellen üblicherweise 
nicht ausgestattet, die LTT-Parameter sind aber so ausgelegt, dass sie trotz 
der veränderten Fokusposition einen stabilen Prozess und eine Kante gu- 
ter Qualität gewährleisten. Wie in Abbildung 4.3(b) zu sehen ist, ist der 
Einfluss des thermisch veränderten Brechverhaltens auf den Fokusdurch- 
messer vernachlässigbar klein. 

Bei den anderen Prozessparametern ADB, Vorschub und Gasdruck sind 
solche Veränderungen durch thermische Einflüsse nicht bekannt. Beim 
ADB wird mithilfe einer kapazitiven Regelung dafür gesorgt, dass der Soll- 
Abstand zum Blech auch bei einer nicht perfekt ebenen Blechoberfläche 
eingehalten wird. 

Während des Schneidexperiments wurde der Maschinenzustand regel- 
mäßig durch die manuelle Prüfung verschiedener Einzelkomponenten 
(Düse, Querblasdüse, Keramikkopf, Schutzglas, Strahlmittigkeit, Optiken, 
Fokus-Offset) überwacht. Zusätzlich wurden das Schutzglas und die Düse 
automatisch nach jedem 25. Teil kontrolliert. 


4.2 Objektive Merkmale der Schnittkante 


4.2.1 Messmethodik 


Die quadratischen Proben haben eine Blechdicke von 3mm und eine Kan- 
tenlänge von 10 cm, von der nur die mittleren 5 cm vermessen wurden. Zur 
Bestimmung objektiver Merkmale der Schnittfläche und des Grats wurde 
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(a) Verschiebung des Strahlfokus. (b) Strahldurchmesser. 


Abbildung 4.3 Verschiebung der Fokusposition und Veränderung des Strahldurchmessers 
ab dem Einschalten des Laserstrahls zum Zeitpunkt 0s. 


jede Schnittkante aus zwei unterschiedlichen Perspektiven erfasst. Aus je- 
der Perspektive wurde ein RGB-Bild und eine pixelgleiche 3D-Punktwolke 
aufgenommen. Das dafür verwendete Messsystem war das VR-3200 3D- 
Profilometer der Keyence Corporation. Dessen technische Daten sind in 
Anhang A.1 zu finden. Die Vermessung der vier Kanten eines Teils aus 
einer Perspektive dauerte ca. 15 min. Die Vermessung aller 899 Teile aus 
beiden Perspektiven dauerte ungefähr 450 Stunden. 


4.2.1.1 Messprinzip 


Das VR-3200 verwendet für die Aufnahme von RGB-Bildern rote, grüne 
und blaue LEDs in Kombination mit einem monochromatischen CMOS- 
Chip. 3D-Oberflächenprofile werden mittels Lichtschnitt erfasst. Dieses 
Verfahren macht sich das Triangulationsprinzip zu nutze. Lichtlinien wer- 
den auf das zu vermessende Objekt gestrahlt und das an der Oberfläche 
des Objekts gestreute Licht wird von einer Kamera beobachtet. Die Hö- 
hendifferenz h des Objektes entspricht dem Quotienten 


ô 


O (4.1) 


aus der lateralen Verschiebung ô der Lichtlinie (vertikal zur optischen 
Achse der Kamera) und dem Tangens des Triangulationswinkels 6 bezüg- 
lich der optischen Achse der Kamera [BPF16]. Im VR-3200 wird für die 
Erzeugung der Lichtlinien eine weiße LED verwendet. Die Linien werden, 
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wie in Abbildung 4.4(a) zu sehen, von zwei Seiten jeweils unter dem Tri- 
angulationswinkel auf das Objekt gestrahlt. Die Erfassung der lateralen 
Verschiebung erfolgt mit einem doppelt telezentrischen Objektiv und dem 
bereits erwähnten CMOS-Chip. 


4.2.1.2 Probenpositionierung 


Die Perspektive des Messgeräts auf die Schnittfläche ist in den Abbil- 
dungen 4.4(b) und 4.4(c) gezeigt. Die Proben wurden so in die eigens 
entwickelte Halterung eingelegt, dass sich die Schnittfläche parallel zur 
Ebene des CMOS-Sensors befand. Die Lichtlinien verliefen entlang der 
Schnittkante. Für die Vermessung des Grats wurden die Proben anders po- 
sitioniert, da aufgrund der unbekannten exakten Dicke des Blechs aus dem 
frontalen Blick auf die Schnittfläche nicht auf die Höhe des Grats geschlos- 
sen werden kann. Die Unterseite des Blechs wurde, wie in Abbildung 
4.4(d) zu sehen, parallel zur Kamera ausgerichtet und diente als Refe- 
renzfläche. Die Lichtlinien verliefen quer zum Grat. Es wäre vorteilhaft 
gewesen, die Blechunterseite bei der Gratmessung nicht parallel, sondern 
schräg zur Kamera auszurichten, weil dann nicht nur die oberste Spitze 
des Grats, sondern die gesamte Flanke sichtbar gewesen wäre. Aufgrund 
der geringen Tiefenschärfe von 1mm (+0,5 mm) war dies jedoch nicht 
möglich. 


4.2.1.3 Messfehler 


Bei der Erfassung der 3D-Punktwolken mancher Schnittflächen kommt 
es zu Fehlern. Ein typisches Beispiel für das beschriebene Problem ist in 
Abbildung 4.5 zu sehen. Dort ist ein zweimal vermessener Ausschnitt 
der Kante 0012-4 gezeigt. Während die RGB-Bilder beider Messungen 
sehr ähnlich aussehen (siehe Abbildung 4.5(a) und 4.5(c)), unterscheiden 
sich die 3D-Punktwolken, insbesondere im Bereich der Blechoberkante 
deutlich. Bei der Messung I treten tiefe Löcher auf, bei der Messung II sind 
diese verschwunden. Die stichprobenartige Untersuchung einiger Kanten 
mit einem Mikroskop zeigte, dass es sich bei den tiefen Löchern stets um 
Messfehler handelt. Die in Abbildung 4.5 gezeigte Kante wurde bei beiden 
Messdurchläufen in dieselbe Probenhalterung eingespannt und mit den- 
selben Einstellungen vermessen. Die minimal andere Positionierung der 
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CMOS 
Sensor 


(a) Messprinzip Lichtschnitt. (b) Probenpositionierung Schnittfläche. 


(c) Perspektive auf die Schnittfläche. (d) Perspektive auf den Grat. 


Abbildung 4.4 Messprinzip im VR-3200 Messgerät, Probenpositionierung bei der Aufnah- 
me der Schnittfläche und Perspektive des Messgeräts bei der Aufnahme der Schnittfläche 
und des Grats. Der erfasste Bereich ist in Abbildung (c) bzw. (d) jeweils rot eingerahmt. 
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(c) RGB-Bild, Messung II. (d) 3D-Punktwolke, Messung I. 


Abbildung 4.5 RGB-Bilder und 3D-Punktwolken der Kante 0012-4 für zwei verschiedene 
Messdurchgänge. Bei Messdurchgang I treten Fehler auf. 


Probe durch das erneute Einlegen führt dazu, dass der Fehler verschwin- 
det. In Abschnitt 6.1.2 des Ergebniskapitels werden die Gründe für diese 
Beobachtung diskutiert und das Problem wird detailliert analysiert. 

Bei den Falschfarbendarstellungen der 3D-Punktwolken ist zu beachten, 
dass in der Punktwolke Werte enthalten sein können, die außerhalb von 
den Grenzen der Farbskala liegen. Dies ist durch die pfeilförmigen Ab- 
schlüsse der Skala angedeutet und geschieht zu Gunsten der Auflösung 
kleinerer Werte. Kleinere bzw. größere Werte sind einheitlich dunkelblau 
bzw. dunkelrot eingefärbt. In Abbildung 4.5(b) trifft dies zum Beispiel auf 
die Löcher im oberen Bereich zu. 

Auf die weitere Verwendung der 3D-Messdaten haben diese Fehler 
große Auswirkungen. Hiervon ist insbesondere die Rautiefenmessung be- 
troffen, die auf der Höhendifferenz zwischen der höchsten Spitze und der 
tiefsten Senke basiert (siehe Abschnitt 2.2.1.1). Die tiefen Senken verursa- 
chen hohe Rautiefenwerte. Dies verschlechtert die Datenqualität deutlich 
und wird im weiteren Verlauf der Arbeit immer wieder thematisiert. 
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4.2.2 RGB-Bild und 3D-Punktwolke 


Mit einer Aufnahme kann ein 7,6mm x 5,7mm großer Bereich erfasst 
werden. Für die Aufnahme der 5cm langen Schnittkante werden meh- 
rere Aufnahmen zusammengesetzt (engl. stiching), sodass ein 7,6mm x 
50,0 mm großes Bild entsteht. Die Bildgröße in Pixel beträgt 521 x 3400. 
Ein Pixel entspricht also einem Bereich von ca. 15 um x 15 um. Das RGB- 
Bild und die 3D-Punktwolke sind pixelgleich. Ersteres hat eine Farbtiefe 
von 8bit pro Kanal. Die Pixel der 3D-Punktwolke beinhalten positive und 
negative Höhenwerte in pm. Pixel mit positiven Werten liegen oberhalb 
des Höhen-Mittelwerts, Pixel mit negativen Höhenwerten befinden sich 
unterhalb. Die Genauigkeit der Höhenmessung beträgt +3 um und die 
laterale Genauigkeit liegt bei +2 um. 


4.2.2.1 Vorverarbeitung der RGB-Bilder und 3D-Punktwolken für CNNs 


Die Aufnahmen des Grats wurden nicht als Eingangsdaten für CNNs 
genutzt. Die RGB-Bilder und 3D-Punktwolken der Schnittfläche wurden 
wie folgt vorverarbeitet. 

Die Bilder wurden zunächst zugeschnitten, um den Hintergrund zu 
entfernen. Hierfür wurde der Canny-Algorithmus [Can86] verwendet, 
mit dem die Ober- und Unterkante der Schnittkante im RGB-Bild identifi- 
ziert werden konnten. Anschließend wurde der Hintergrund entfernt. Die 
Oberkante wurde dann genutzt, um die Schnittkante möglichst horizontal 
im Bild auszurichten. Für alle in dieser Arbeit gezeigten Schnittkanten 
gilt, dass die Oberseite des Blechs auch in der Abbildung oben ist. Die 
Schnittrichtung war bei allen Kanten von rechts nach links. 

Das Zuschneiden und horizontale Ausrichten konnten anschließend auf 
die 3D-Punktwolke übertragen werden, da beide Aufnahmen pixelgleich 
sind. Die Höhenwerte wurden zusätzlich mithilfe einer Referenzebene 
korrigiert, um den Einfluss der Positionierung der Probe zu eliminieren. 
Dazu wurde in Schnittrichtung (lange Bildseite) eine Ebene mithilfe einer 
linearen Regression in die gemessene Oberfläche gefittet und anschlie- 
fend abgezogen. Quer zur Schnittrichtung (kurze Bildseite) wurde keine 
Korrektur ausgeführt, um keinen Einfluss auf die Rechtwinkligkeitstole- 
ranz zu nehmen. Danach wurde die 3D-Punktwolke in ein Graustufenbild 
mit einer Farbtiefe von 8 bit überführt. Um die Auflösung im relevanten 
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Abbildung 4.6 Vorverarbeitung der Bilder zur Verwendung als Eingangsdaten für neuro- 
nale Netze. Zuerst wird die Schnittkante des hier gezeigten Originalbildes freigestellt und 
horizontal ausgerichtet. Dann wird sie in 15 quadratische Bilder zerschnitten (von denen hier 
drei gezeigt sind). Die quadratischen Bilder werden auf die einheitliche Größe von 224 x 224 
Pixeln skaliert. 


Bereich zu maximieren, wurden Werte, die mehr als das Dreifache des 
Interquartilsabstands unterhalb des 0,25-Quantils bzw. oberhalb des 0,75- 
Quantils lagen, durch den Median ersetzt. Der kleinste Höhenwert wurde 
auf 1 gesetzt, der größte auf 255. Fehlende Werte erhielten den Wert 0. 
Dieses Graustufenbild wird im Folgenden auch als Höhenbild bezeichnet. 

Die Bilder haben - unabhängig vom Typ - dasselbe längliche Format mit 
den ungefähren Abmessungen 215 x 3400 Pixel (abhängig von der Grat- 
höhe) und bestehen aus über 700000 Pixeln. Für das Training neuronaler 
Netze ist dieses Format äußerst unüblich, außerdem steigt der Rechenauf- 
wand mit der Neuronenanzahl. Gleichzeitig beinhaltet ein solches Bild 
viel redundante Information, weil sich das Aussehen in Schnittrichtung 
entlang der gesamten Kante kaum verändert. Deshalb wurde jedes Bild in 
15 quadratische Teile geschnitten, die anschließend auf die Größe 224 x 
224 Pixel skaliert wurden. Dies ist in Abbildung 4.6 für ein RGB-Bild zu 
sehen. Für jede Kante liegen 15 und für jedes Teil 60 Bilder eines Typs vor. 

RGB und Höhenbild wurden zu einem dritten Typ, einem RGBD-Bild 
(von engl. depth, Tiefe) mit vier Kanälen, zusammengesetzt. Dieses enthält 
sowohl die Farb- als auch die Höheninformation. Ein Beispiel für ein RGB-, 
ein zugehöriges Höhen- und RGBD-Bild ist in Tabelle 4.2 abgebildet. 
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Tabelle 4.2 Beispiel für ein RGB-, ein Höhen- und ein RGBD-Bild. Das RGBD-Bild hat vier 
Kanäle und ist hier als RGBA-Bild dargestellt. Die Höhe bestimmt in dieser Darstellung die 
Transparenz der RGB-Pixel. 


Bildtyp RGB Höhe RGBD 
RD 
MER 


Kanäle 3 


4.2.3 Objektive Merkmale der Schnittfläche 


Aus den gemessenen 3D-Punktwolken von Schnittfläche und Grat wurden 
die Rautiefe und die Rechtwinkligkeitstoleranz sowie die Grathöhe und 
Gratbreite abgeleitet. Ausgangsdaten dafür waren die 3D-Rohdaten (und 
nicht die im vorhergehenden Abschnitt beschriebenen Graustufenbilder). 


4.2.3.1 Rautiefe 


Zur Bestimmung der Rautiefe mit der VR-3200 Software wurden die Roh- 
daten zunächst mit einer Referenzebene korrigiert, um den Einfluss der 
Probenpositionierung zu eliminieren. Anschließend wurden Messlinien in 
Schnittrichtung in verschiedenen Tiefen des Blechs definiert. Die oberste 
Messlinie hat einen Abstand von 0,3 mm von der Oberkante, die weiteren 
Messlinien befinden sich in 0,3 mm-Schritten darunter. Die unterste Mess- 
linie hat einen Abstand von 2,7 mm von der Ober- und ca. 0,3 mm von der 
Unterkante. Die Messlinien werden entsprechend ihrer Position mit 03, 06, 
09 usw. bezeichnet. Im Folgenden muss zwischen der Messung nach Norm 
und der in dieser Arbeit alternativ verwendeten Methode unterschieden 
werden. 


Messung nach DIN EN ISO 4288 [Deu98b] Wie in Abschnitt 2.2.1.1 er- 
klärt und in der Tabelle 2.2 zusammengefasst, muss bei der Messung 
nach Norm für die zu erwartenden Rautiefenwerte eine Messstrecke von 
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4,0; 12,5 oder 40,0 mm Länge mit einer Grenzwellenlänge von 0,8; 2,5 oder 
8,0 mm ausgewertet werden. Da ein 50 mm langer Bereich der Schnittkante 
zur Verfügung steht, kann in jeder Blechtiefe nur einmal gemessen werden. 
Je nach Wertebereich von Rz5 ist nur eine der drei Messungen gültig. Die 
anderen zwei werden verworfen. So erhält man zu jeder Blechtiefe genau 
einen Rz5-Wert. Da nach DIN EN ISO 9013 [Deu17] nur der maximale 
Rautiefenwert interessant ist, ergibt sich ein Rz5 Wert pro Schnittkante. 

Diese Messmethode hat mehrere Nachteile: Es kommt zu inkonsistenten 
Werten, weil der Wechsel der Grenzwellenlänge (und damit der Eigen- 
schaften des Filters, das die kurz- von den langwelligen Anteilen trennt) 
zwischen verschiedenen Rautiefenbereichen zu Sprüngen führt. Nachtei- 
lig ist außerdem, dass nur eine Messung für jede Blechtiefe möglich ist. 
Es liegen also keine Vergleichswerte in derselben Blechtiefe vor, was eine 
Ausreißerdetektion erschwert. Da nur der maximale Wert angegeben wird, 
fallen die Ausreißer zusätzlich ins Gewicht. Die Angabe eines Rz5-Wertes 
spiegelt das tatsächliche Aussehen der Schnittkante, die oft mehrere unter- 
schiedlich raue Schichten aufweist, nicht wider. Diese Messmethode wird 
im weiteren Verlauf der Arbeit daher nicht mehr angewendet. 


Messung in fünf Bereichen Aufgrund der beschriebenen Nachteile der 
normkonformen Rautiefenmessung wurde eine an die Norm angelehn- 
te, aber etwas robustere Methode entwickelt. Streng genommen ist die 
Messung der Rautiefe mit einem optischen Verfahren sowieso nicht norm- 
konform, da ein Tastverfahren empfohlen wird. Aus Zeitgründen kam 
dies für die Vermessung aber nicht infrage. 

Der aufgenommene Bereich der Schnittkante wurde, wie in Abbildung 
4.7 zu sehen ist, in fünf gleich große Abschnitte geteilt. In jedem Bereich 
wurden neun Messlinien in verschiedenen Blechtiefen wie oben beschrie- 
ben platziert. Es wurde eine feste Grenzwellenlänge von 2,5 mm gewählt. 
Anstatt des Rz5-Wertes muss jeweils der Rz3-Wert berechnet werden, weil 
aufgrund der Bereichsgröße von 10 mm nur über drei statt fünf Einzel- 
messstrecken gemittelt werden kann. Auf diese Weise erhält man für jede 
Schnittfläche statt eines Rz5-Wertes nach Norm 45 Rz3-Werte, fünf für 
jede der neun Blechtiefen. Die einzelnen Rautiefenwerte werden mit 


RV”? mit Mz € {03, 06, ..., 27} und Mp € {1,2,3,4,5} (4.2) 
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bezeichnet, wobei M, die Messlinie und Mpg den Messbereich benennt. 
Der große Vorteil dieser Methode ist, dass die größere Anzahl an Mess- 
stellen die Detektion und Korrektur von Messfehlern ermöglicht. Die 
Datenqualität kann z. B. quantifiziert werden, indem die absoluten 


M M ; M 
aa = Ran” — iini an) (4.3) 


oder die relativen Differenzen 


M ‘ M 
sM) _ Ra -= minm, (a 


ML, ~~ (Mp) 
` B 
min ys, (Rei ) 


(4.4) 


der fünf Rz3-Werte einer Messlinie Mz, betrachtet werden. Da die fünf 
Bereiche einer Kante mit denselben Prozessparametern und (fast) unter 
denselben Umgebungsbedingungen geschnitten wurden, sollte sich die 
Rautiefe kaum unterscheiden. Im Allgemeinen ist diese Differenzbildung 
sicherlich keine geeignete Methode, um Ausreißer zu finden, da das Mini- 
mum selbst empfindlich von Ausreißern abhängen kann. Die in Abschnitt 
4.2.1.3 und 6.1.2 beschriebenen Messprobleme führen jedoch stets zu einer 
Erhöhung des Rautiefenwerts. Außerdem können basierend auf fünf Wer- 
ten keine verlässlichen statistischen Kennzahlen, wie beispielsweise die 
Standardabweichung, ausgerechnet werden. Deshalb wird das Minimum 
der fünf Messwerte als verlässlichster Wert eingestuft. 


4.2.3.2 Rechtwinkligkeitstoleranz 


Analog zur Messung der Rautiefe wird auch die Rechtwinkligkeitstoleranz 
u in fünf Bereichen der Schnittfläche ermittelt. In jedem Bereich wird dafür 
eine Messlinie verwendet, die orthogonal zu den Rautiefenmesslinien 
verläuft. Wie in Abschnitt 2.2.1 beschrieben, wird nur der Bereich ab 0,3 
bis 2,7 mm unterhalb der Blechoberkante vermessen, damit Verformungen 
der Ober- und Unterkante nicht eingehen. Daraus resultieren fünf Werte 


2) pro Kante. 


4.2.4 Objektive Merkmale des Grats 


Für die Ermittlung der Gratmerkmale wird eine aus einer anderen Per- 
spektive (siehe Abbildung 4.4(d)) aufgenommene 3D-Punktwolke heran- 
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Abbildung 4.7 Aufteilung der Schnittfläche in fünf Bereiche Mp mit Nummerierung in 
Schnittrichtung und Definition von neun Messlinien My; in jedem Bereich. Diese werden 
entsprechend ihres Abstands von der Blechoberkante mit 03 (0,3 mm) bis 27 (2,7 mm) be- 
zeichnet. 


gezogen. Da die Gratperlen meist dunkel verfärbt sind, ist nicht davon 
auszugehen, dass es zu den in Abschnitt 4.2.1.3 beschriebenen Messfehlern 
kommt. 

Analog zur Rautiefenmessung wird der aufgenommene Bereich der 
Schnittkante in fünf Teilbereiche aufgeteilt. Die Norm DIN EN ISO 9013 
[Deu17] macht keinerlei Vorgaben zur Vermessung des Grats. In dieser 
Arbeit wurden zwei Eigenschaften identifiziert, die besonders interessant 
sein könnten, die Höhe und die Breite des Grats. 

Diese Merkmale können mit dem VR-3200 nicht direkt erfasst werden, 
sondern wurden mithilfe der in Abbildung 4.8 gezeigten Profilmessungen 
konstruiert. Es wurden 26 Profilmesslinien im Abstand von 20 um parallel 
zur Schnittrichtung auf den Grat gelegt. In Abbildung 4.8(a) sind die bei- 
den äußersten Messlinien eingetragen, die anderen 24 liegen dazwischen. 
Analog zur Rautiefe werden sie entsprechend ihrer Position benannt mit 
000, 002, 004 usw. Jede Messlinie erfasst die Höhe des Grats bezüglich der 
Blechunterseite. Ein Beispiel ist in Abbildung 4.8(b) gezeigt. 

Zur Ermittlung der Grathöhe wird aus jeder Messlinie der größte Hö- 
henwert (im Beispiel 440 um) extrahiert. Der maximale Höhenwert der 26 
Profilmesslinien wird als Grathöhe definiert. 

Für die Gratbreite werden alle Messlinien betrachtet, die einen Höhen- 
wert größer als 10 um aufweisen. Der Abstand zwischen der ersten und 
der letzten Messlinie, für die dies ohne Unterbrechungen zutrifft, wird 
Gratbreite genannt. Man erhält so einen Wert für die Grathöhe und einen 
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(a) Messlinien in einem der fiinf Messbereiche. (b) Beispiel fiir eine Profilmessung. 


Abbildung 4.8 Vermessung des Grats mit Profilmesslinien. Die Messlinien werden entspre- 
chend ihres Abstands von der ersten Linie mit 000 (0 mm) bis 500 (5 mm) benannt. 


für die Gratbreite in jedem der fünf Messbereiche. Analog zur Rautiefe 
können diese genutzt werden, um eventuelle Mess- oder Prozessfehler zu 
detektieren. 


4.3 AusreiBerkorrektur 


Für jede Schnittkante liegen 45 Rautiefenmesswerte vor. Diese sind wie in 
Abschnitt 4.2.1.3 beschrieben teilweise fehlerbehaftet. Da sich dies negativ 
auf die Güte der datenbasierten Modelle auswirken könnte, wurden drei 
Methoden zur Verbesserung der Datenqualität evaluiert. 


Kombination zweier Messdurchgänge Eine Möglichkeit, die Qualität 
der Messdaten zu verbessern, ist es, mehrere Messungen durchzuführen 
und die Messergebnisse zu kombinieren. Die Wiederholung der Messung 
ist sehr zeitaufwendig und wurde deshalb nur einmal durchgeführt. Da 
nur Messfehler bekannt sind, die zu einer Erhöhung des Rz-Wertes führen, 
wurden die Werte der beiden Messdurchgänge komponentenweise (selbe 
Kante, selbe Messlinie, selber Bereich) verglichen und es wurde der jeweils 
kleinere Wert übernommen. 

Jede Schnittkante mehrmals in die Probenhalterung einzulegen und 
zu vermessen, ist sicherlich der zuverlässigste Weg, um die Datenqua- 
lität zu verbessern. Dies ist jedoch sehr zeitaufwendig. Darum wurden 
zwei Ansätze evaluiert, mit denen die Datenqualität basierend auf einem 
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Messdurchgang verbessert werden kann. Dafür musste die Annahme ge- 
troffen werden, dass die Rautiefenwerte einer Messlinie im Idealfall nicht 
voneinander abweichen. Dies soll sowohl für die fünf Werte innerhalb 
einer Kante als auch näherungsweise für die 20 Rautiefenwerte eines Teils 
gelten, da diese mit denselben Prozessparametern erzeugt wurden und 
sich nur hinsichtlich der Walz- und Schnittrichtung unterscheiden. Für die 
Korrektur wurden bewusst eine sehr einfache Methode mit einem statis- 
tischen Schwellenwert und ein sehr fortgeschrittener Ansatz mit einem 
Autoencoder gewählt. 


Std-Schwelle und Mittelwertkorrektur Der Mittelwert und die Standard- 
abweichung (Std) der 20 Rautiefenwerte jeder Messlinie werden berechnet. 
Weicht ein Rz-Wert um mehr als einen Schwellenwert vom Mittelwert 
ab, wird dieser als Ausreißer betrachtet. Der Schwellenwert entspricht 
dem 1,7-fachen der Standardabweichung. Die Begründung dafür ist in 
Abschnitt 6.1.2.2 zu finden. Ausreißer werden anschließend durch den 
(neu berechneten) Mittelwert ersetzt. 

Alternativ zu den oben beschriebenen Methoden wurde ein Autoenco- 
der zur Detektion und Korrektur der Messdaten verwendet. Dieser wird 
im Folgenden näher thematisiert. 


4.3.1 Korrektur mit einem Autoencoder 


Autoencoder sind spezielle künstliche neuronale Netze. Anders als bei 
den meisten Anwendungen von KNNs wird f(x) = æ anstatt f(x) = y be- 
rechnet [Agg17]. Beim Training wird der Abstand zwischen dem Original 
am Eingang und der sogenannten Rekonstruktion am Ausgang minimiert. 
Die generelle Struktur eines Autoencoders umfasst einen Encoder und 
einen Decoder, zwischen denen sich der sogenannte Flaschenhals (engl. 
bottleneck) befindet. Dieser umfasst meistens deutlich weniger Neuronen 
als die Ein- und Ausgangsschicht. Der Encoder bildet die am Eingang 
übergebene Information auf eine komprimierte Repräsentation im Fla- 
schenhals ab. Der Decoder verwendet die komprimierte Information, um 
eine Rekonstruktion des Eingangs zu erstellen. Oft (aber nicht notwen- 
digerweise) handelt es sich bei Encoder und Decoder um symmetrisch 
aufgebaute neuronale Netze. 
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Es gibt Anwendungen, bei denen man sich für die Neuronen des Fla- 
schenhalses interessiert, die die komprimierte Information beinhalten. 
Autoencoder können also zur Dimensionsreduktion verwendet werden. 
Sie generieren häufig bessere Repräsentationen als eine Hauptkompo- 
nentenanalyse oder eine Matrix-Faktorisierung [Hin06]. Der Hauptgrund 
dafür ist, dass sich mit nicht linearen neuronalen Netzen beliebige Daten- 
verteilungen besser modellieren lassen. Es ist davon auszugehen, dass 
sie bei der Detektion von Ausreißern ebenfalls besser abschneiden. Bei 
der Ausreißerdetektion werden nicht die Neuronen des Flaschenhalses 
verwendet, sondern die Rekonstruktion am Ausgang wird komponenten- 
weise mit dem Eingang verglichen. Da die komprimierte Information im 
Flaschenhals des Autoencoders robust gegenüber Rauschen und Ausrei- 
fern ist, werden diese am Ausgang nicht rekonstruiert. Deshalb deuten 
große Unterschiede zwischen Eingang und Rekonstruktion auf Ausreißer 
in den Eingangsdaten hin. [Agg17] 

Aggarwal [Agg17] schreibt, dass die Verwendung neuronaler Netze 
zur Ausreißerdetektion in der Praxis herausfordernd ist, weil diese im 
Training empfindlich auf Rauschen und Ausreißer reagieren. Da Ausreißer 
während des Trainingsprozesses als normale Datenpunkte behandelt wer- 
den, beeinflussen sie die zu minimierende Verlustfunktion. Er rät deshalb, 
mehrere Modelle jeweils auf Teilmengen der zur Verfügung stehenden 
Daten zu trainieren und die Ausreißerdetektion anschließend nur für un- 
bekannte Daten durchzuführen. Eine andere Möglichkeit, die Robustheit 
zu erhöhen, sei es, Dropout zu verwenden. 

Vincent et al. [Vin+10] schlagen eine andere Herangehensweise vor, die 
in dieser Arbeit eingesetzt wird: Der Autoencoder wird nicht mithilfe der 
Originaldaten trainiert, sondern mit einer zusätzlich stark verfälschten 
Version &. Dazu werden in einem ersten Schritt in jedes Trainingsbeispiel 
viele weitere Ausreißer eingefügt und anschließend wird Dropout ange- 
wendet. Diese verfälschte Information wird während des Trainings am 
Eingang des Autoencoders übergeben. Die unverfälschten Originaldaten 
werden als Label genutzt. Das Ziel des Trainings ist es, die originalen 
Daten möglichst gut aus den verfälschten zu rekonstruieren: f (Z) = x. So 
wird eine gewisse Unabhängigkeit von der Datenqualität der Originalda- 
ten erreicht und das Modell lernt, Rauschen und Ausreißer zu entfernen 
bzw. zu korrigieren, anstatt nur eine identische Abbildung durchzuführen. 
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4.3 Ausreißerkorrektur 


Das so trainierte Modell kann anschließend zur Ausreißerkorrektur einge- 
setzt werden. In diesem Fall werden die Originaldaten ohne zusätzliche 
Verfälschung übergeben. 


4.3.1.1 Verfälschung der Rautiefendaten für das Modelltraining 


Die originalen Rautiefenmesswerte werden als Tensor mit den Dimen- 
sionen 5 x 9 x 4an den Autoencoder übergeben. Durch diese Struktur 
bleibt die räumliche Information der Daten (fünf Bereiche, neun Mess- 
linien, vier Kanten) erhalten. Um den Autoencoder zu trainieren, wird 
die Eingangsdatenqualität massiv verschlechtert. Zuerst werden zusätz- 
liche (zufällige) Ausreißer in die Originaldaten eingefügt. Um negative 
oder zu große Werte zu vermeiden, werden Ausreißer, die außerhalb 
des Rz-Bereichs der Originaldaten (4 bis 534 um) liegen, auf die Grenzen 
dieses Bereichs gesetzt. Die Wahrscheinlichkeit für das Einfügen solcher 
zusätzlicher Ausreißer beträgt 20%. Im Schnitt werden also 36 der 180 
Eingangsneuronen auf diese Weise manipuliert. In einem zweiten Schritt 
entfernt eine Dropout-Schicht 30% aller Eingangswerte. Anschließend 
werden diese stark verrauschten Daten an den Autoencoder übergeben. 
Die zu minimierende Verlustfunktion im Training ist der mittlere absolute 
Fehler (siehe Formel (3.7)) zwischen den originalen Daten als Label und 
der Repräsentation. 


4.3.1.2 Konfiguration des Autoencoders 


Die Architektur des verwendeten Autoencoders ist in Abbildung 4.9 ver- 
anschaulicht. Encoder und Decoder bestehen jeweils aus drei Highway- 
Blöcken (siehe Abschnitt 3.2.4) und einer Faltungsschicht zur Dimensions- 
reduktion im Flaschenhals. Innerhalb eines Highway-Blocks wenden die 
Faltungsschichten H und T jeweils vier Filter der Größe 3 x 3 auf ihre 
Vorgängerschicht an. Jede dieser Schichten hat 148 trainierbare Parameter. 
H benutzt ReLU als Aktivierungsfunktion, bei T kommt die logistische 
Funktion zum Einsatz (siehe Abschnitt 3.2.1.2). Im Flaschenhals wird 
ebenfalls eine Faltung mit einem Filter derselben Größe verwendet. Dort 
wird die Anzahl der Neuronen auf ein Viertel reduziert. Encoder und 
Decoder sind symmetrisch aufgebaut. Mithilfe von Zero Padding (siehe 
Abschnitt 3.2.3) wird eine Verringerung der räumlichen Dimension bei der 
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Abbildung 4.9 Architektur des Autoencoders zur Ausreißerkorrektur in den Rautiefenmess- 
daten. Encoder und Decoder bestehen jeweils aus drei Highway-Blöcken. Für das Training 
wird am Eingang eine verfälschte Version & der Originaldaten x übergeben. Entsprechend 
muss die Repräsentation in diesem Fall mit f(&) bezeichnet werden. Für die Bereinigung der 
Messfehler wird der trainierte Autoencoder eingesetzt: æ wird übergeben und die berechnete 
Repräsentation f(x) wird weiterverwendet. 


Encoder Decoder f(z) 


O- 


Flaschenhals 


Faltung verhindert. Im Anschluss an jeden Highway-Block und die Fal- 
tungsschichten im Flaschenhals sorgen eine Dropout- und eine BN-Schicht 
(siehe Abschnitt 3.2.3) für einen effektiveren Trainingsprozess. Insgesamt 
hat der Autoencoder 2117 Modellparameter, von denen 2059 während des 
Trainingsprozesses (mit dem Adam-Optimierer [BK15]) optimiert werden. 


4.3.1.3 Ausreißerkorrektur 


Nach dem Training kann der Autoencoder für die Korrektur der Messda- 
ten verwendet werden. Dazu werden die originalen Daten an das Modell 
übergeben, welches daraus eine Rekonstruktion berechnet. Große Unter- 
schiede zwischen Originaldaten und Rekonstruktion deuten auf Ausreißer 
hin. Damit nicht alle Werte geändert werden, was zur Folge hätte, dass 
die gesamten im weiteren Verlauf der Arbeit verwendeten Rautiefendaten 
durch ein neuronales Netz verändert wären, wird der ursprüngliche Wert 
Zorig. nur durch den neu berechneten z,.p;. ersetzt, falls gilt: 


|Zorig. — Trepi: > 0,35. (4.5) 


orig. 
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4.4 Konzept der Expertenbefragung 


Falls diese Bedingung nicht erfüllt ist, wird der ursprüngliche Wert bei- 
behalten. Die Begründung für die Wahl einer Schwelle von 0,35 ist in 
Abschnitt 6.1.2.2 zu finden. 


4.4 Konzept der Expertenbefragung 


In der Praxis wird die Schnittkantenqualität üblicherweise nicht anhand 
objektiver Messwerte beurteilt, sondern subjektiv durch den Menschen. 
In dieser Arbeit wurde eine Expertenbefragung durchgeführt, um einer- 
seits zu untersuchen, inwieweit eine einzelne Person in der Lage ist, ein 
repräsentatives Qualitätsurteil zu fällen und um andererseits zu verste- 
hen, welche Eigenschaften der Schnittkante für den subjektiven Eindruck 
besonders wichtig sind. 

Bei den befragten fünf Personen handelte es sich um TRUMPF- 
Versuchsmitarbeiter mit langjähriger Erfahrung im Laserschneiden. Laien 
kommen für eine derartige Aufgabe nicht infrage. Aus Zeitgründen konn- 
ten nicht alle geschnittenen Kanten beurteilt werden. Stattdessen wurden 
100 Schnittkanten ausgewählt und verteilt über drei Wochen bewertet. 

In Ermangelung eines anderen Kriteriums wurde die gemessene Rau- 
tiefe (siehe Abschnitt 4.2.3.1) der Kanten verwendet, um aus den 3596 
Schnittkanten 100 repräsentative auszuwählen. Dafür wurde die Bandbrei- 
te der Rautiefe so in zehn Intervalle aufgeteilt, dass jeder Bereich gerade 
10 % der Schnittkanten enthielt. Anschließend wurden aus jedem Bereich 
zufällig zehn Kanten ausgewählt. 

Jede Woche wurden 40 Schnittkanten beurteilt, dabei waren 30 Kanten 
neu, zehn Kanten wurden in jeder der drei Wochen ohne das Wissen der 
Befragten wiederholt. Es wurde dabei nur die gerade Schnittkante bewer- 
tet, die Ecken waren abgedeckt. Die Experten durften die Teile in die Hand 
nehmen und die Kanten anschauen und anfassen, wie sie es gewohnt sind. 
Messmittel standen keine zur Verfügung. Jeder Experte musste jede Kante 
mit zwei Schulnoten (von 1 „sehr gut” bis 6 „ungenügend“) bewerten. 
Eine Note sollte für die Qualität der Schnittfläche und eine für die Qualität 
des Grats vergeben werden. 

In Woche 1 sollten die Experten zusätzlich zu der Schulnote den Haupt- 
grund für ihre Bewertung der Schnittfläche als Freitext angeben. Die Ant- 
worten wurden in fünf Kategorien zusammengefasst: Rauheit, Rechtwink- 
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Tabelle 4.3 Übersicht über die Datenbasis. 


Parameterkombinationen 1126 
Unterschiedliche Parameterkombinationen 1050 
Vollfaktoriell variierte Prozessparameter 4 
Fehlschnitte 227 
Verbleibende Teile 899 
Davon mit verschiedenen Parameterkombinationen 834 
Kanten pro Teil 4 


ligkeit, Verfärbung, Homogenität und Verrundung der Oberkante. In den 
darauffolgenden Wochen sollten diese Kategorien zusätzlich zur Beno- 
tung bewertet werden. Dabei gab es nur die Auswahlmöglichkeiten gut, 
mittelmäßig und schlecht. 


4.5 Übersicht über die Datenbasis 


Als kurze Zusammenfassung des Kapitels ist in Tabelle 4.3 eine Über- 
sicht über die Datenbasis gezeigt. Der Versuchsplan bestand aus 1126 
Parameterkombinationen, von denen 1050 verschieden waren. 227 Para- 
meterkombinationen führten zu Fehlschnitten, die Teile konnten nicht 
aus dem Restgitter entnommen werden. 899 Teile konnten entnommen 
und weiter verwendet werden. Jedes Teil hat vier Kanten. Es stehen also 
insgesamt 3596 Kanten zur Verfügung. Die Datenbasis für das Training 
der CNNs enthält über 50000 Bilder, weil es zu jedem Teil 60 quadratische 
Bilder gibt. 

Jede Kante kann anhand einer Identifikationsnummer identifiziert wer- 
den. Diese setzt sich zusammen aus der Identifikationsnummer des Teils, 
einer Zahl zwischen 0001 und 1126, und der angehängten Nummer der 
Kante, -1, -2, -3 oder -4. In Tabelle 4.4 ist gezeigt, welche Daten für jede 
Kante verfügbar sind. 
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Tabelle 4.4 Verfügbare Daten zu jeder der 3596 Kanten. (*Die subjektiven Merkmale sind 


nur für 100 Kanten vorhanden.) 


Prozessparameter 


Zusätzlich 


Abstand Düse-Blech 
Einstellmaß 
Gasdruck 

Vorschub 
Fokusposition 


Prozess-, Maschinendaten 


Blechnummer 

Datum und Uhrzeit 
Position auf dem Blech 
Maschinenzustand 


15 quadratische Bilder 


RGB-Bild 
Graustufen-Höhenbild 
RGBD-Bild (Farbe und Höhe) 


Objektive Merkmale 


45 Rz-Werte 

5 u-Werte 

5 Werte für die Grathöhe 
5 Werte für die Gratbreite 


Subjektive Merkmale* 


Schulnote für die Schnittfläche 
Schulnote für den Grat 
Freitext/Bewertung von fünf Kategorien 
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5 Modellierung und 
Visualisierung 


Dieses Kapitel baut auf den in Kapitel 3 eingeführten Grundlagen des ma- 
schinellen Lernens auf. Sofern nicht anders angegeben sind alle Fachbegrif- 
fe in Abschnitt 3.2.1 zu finden. Zu Beginn werden die CNN-Architekturen 
und -Konfigurationen, die zur Modellierung der Zusammenhänge zwi- 
schen Schnittkante und Prozessparametern sowie zur Schätzung der Rau- 
tiefe verwendet wurden, erläutert. Daran schließt die Herleitung und 
Erklärung der Layer-wise Relevance Propagation an. Mit dieser Visuali- 
sierungstechnik können die von einem CNN erlernten Muster und Zu- 
sammenhänge dargestellt werden. Danach wird kurz auf die Ansätze 
eingegangen, die zur Modellierung der Zusammenhänge zwischen Pro- 
zessparametern und Fehlschnittrisiko, Rautiefe oder Grathöhe genutzt 
wurden. Am Ende des Kapitels werden alle Modellansätze in Tabelle 5.3 
zusammengefasst. 


5.1 Bildbasierte Modellierung mit neuronalen 
Netzen 


5.1.1 Regression der Prozessparameter 


Für die automatisierte Überprüfung des Zustands einer Laserschneidma- 
schine benötigt man ein Modell, welches die zugrunde liegenden Prozess- 
parameter ausgehend von (einem Bild) der Schnittkante schätzt. Mehr zu 
dieser Idee befindet sich in Abschnitt 6.3. Zunächst waren bekannte Netz- 
architekturen (z.B. VGG-Netz [SZ15], AlexNet [KSH17], ResNet [He+16]) 
auf ihre Anwendbarkeit für diese Aufgabe getestet worden. Aufgrund 
der großen Anzahl zu trainierender Modellparameter wurden vortrai- 
nierte Modelle als Ausgangspunkt verwendet. Mit keinem der genann- 
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ten Modelle konnte der gesuchte Zusammenhang zwischen Schnittkante 
und Prozessparametern abgebildet werden. Deshalb wurde eine eigene 
CNN-Architektur entwickelt, die vom VGG16-Netz inspiriert wurde, aber 
deutlich weniger zu erlernende Parameter hat und die deshalb mit der zur 
Verfügung stehenden Datenbasis trainiert werden konnte. 


5.1.1.1 VGG16-Netz 


Das VGG16-Netz wurde 2014 von Simonyan und Zisserman [SZ15] vorge- 
stellt. Die Autoren haben mit dieser Architektur den ersten und zweiten 
Platz der ImageNet Challenge 2014 in den Kategorien Lokalisierung und 
Klassifizierung belegt. Bei dem Wettbewerb ging es darum, ein Modell zu 
trainieren, das 1000 verschiedene Bildkategorien der Datenbank ImageNet 
[Den+09] erkennen und die Objekte im Bild lokalisieren kann. Seitdem 
wurde immer wieder gezeigt, dass die Architektur auch gut für andere 
Daten funktioniert (z.B. zur Detektion von Kiwis auf Basis von RGB- und 
Nahinfrarot-Bilddaten [Liu+20]). 

Das VGG16-Netz besteht aus 16 Schichten, die trainierbare Parameter 
enthalten. Davon sind 13 Faltungsschichten und daran anschließend drei 
vollständig verbundene Schichten. Die Faltungsschichten sind in Blöcken 
organisiert: Die ersten beiden Blöcke enthalten jeweils zwei, die folgenden 
drei jeweils drei Faltungsschichten. Zentrale Ideen des VGG16-Netzes sind 
die Verwendung von 3 x 3 großen Faltungskernen und die mit fortschrei- 
tender Tiefe immer stärkere Reduktion der Größe der Feature Maps. Die 
Größe halbiert sich nach jedem Block von anfangs 224 x 224 Pixeln auf 
7 x 7 Pixel nach dem fünften Block. Die Tiefe der Schichten steigt vom 
Eingang zum Ausgang hin an. Während der erste Block 64 Feature Maps 
aufweist, sind es im zweiten Block 128, im dritten 256 und im vierten und 
fünften Block sogar 512. 

Mit 138 Millionen hat das VGG16-Netz zu viele Parameter, um mit der 
verfügbaren Datenbasis (siehe Abschnitt 4.5) von Grund auf trainiert zu 
werden. Deshalb wurde getestet, ob eine auf den 14 Millionen Bildern der 
ImageNet-Datenbank vortrainierte Version des Modells verwendet wer- 
den kann. Dazu wurden die Parameter der Faltungsschichten, welche die 
Merkmalsextraktion durchführen, unverändert übernommen und nur die 
Parameter der vollständig verbundenen Schichten, welche die Zuordnung 
zwischen Merkmalen und Kategorien vornehmen, wurden neu initiali- 
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5.1 Bildbasierte Modellierung mit neuronalen Netzen 


Tabelle 5.1 Architektur des CNNs zur Regression der Prozessparameter aus einem Bild 
der Schnittkante. B bezeichnet die Nummer des Blocks: B = {1, 2,3, 4}. Nicht eingetragen 
sind die in jeder Schicht (außer GAP, Dropout) angewendete Aktivierungsfunktion sowie die 
Batch-Normalisierung. 


Schicht Eingangsgröße Tiefe Ausgangsgröße 
Eingangsblock 224 x 224 32 112 x 112 

B, Conv I 224/2? x 224/2? 16-2? 204/27 x 224/2?” 

B, Conv II 224/2? x 224/2” 16-2? 224/2” x 224/2” 

B, Conv II 224/2? x 224/2? 16-2? 224/2P™ x 224/27! 
GAP 7x7 = 256 

Dropout 256 = 256 

FC 256 - 5 


siert und während des Trainings optimiert. Es zeigte sich jedoch, dass 
die vortrainierten Schichten keine sinnvollen Merkmale aus den Schnitt- 
kantenbildern extrahieren konnten. Das ist nicht verwunderlich, da die 
ImageNet-Datenbank zwar Texturbilder enthält, aber im Wesentlichen 
Bilder alltäglicher Objekte beinhaltet, deren Merkmale und Strukturen 
sich erheblich von denen von Laserschnittkanten unterscheiden. Deshalb 
wurde eine eigene CNN-Architektur entwickelt und von Grund auf trai- 
niert. 


5.1.1.2 CNN-Architektur 


Die entwickelte CNN-Architektur orientiert sich an den zentralen Ideen 
des VGG-Netzes, hat aber mit 4 statt 138 Millionen eine deutlich kleinere 
Parameteranzahl. Des Weiteren wurden Forschungsergebnisse einbezogen, 
die nach der Veröffentlichung des VGG-Netzes vorgestellt wurden. Die 
Netzarchitektur ist in Tabelle 5.1 zusammengefasst. Eine vereinfachte 
Darstellung ist in Abbildung 5.1 gezeigt. 

Am Eingang des Netzes wird ein Bild mit den Abmessungen 224 x 
224 Pixel und mit einem, drei oder vier Kanälen übergeben. Am Ausgang 
werden die Werte von fünf Prozessparametern (ADB, EM, FP, Gasdruck, 
Vorschub) geschätzt. Das CNN besteht aus 13 Faltungsschichten und einer 
vollständig verbundenen Schicht, die die letzte verdeckte Schicht mit den 
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fünf Ausgängen verbindet. Die Schichten sind in Blöcken organisiert. Es 
gibt einen Eingangsblock bestehend aus einer Faltungsschicht. Dieser 
wird von der von He et al. [He+16] vorgestellten ResNet-Architektur 
übernommen. Dort werden 32 Filter mit einer Größe von 7 x 7 und einer 
Schrittweite von 2 verwendet. Diese Filter haben gegenüber den ansonsten 
genutzten 3 x 3 großen Filtern einen größeren rezeptiven Bereich, was sich 
vorteilhaft auswirken kann. Die Größe des Eingangsbildes wird durch den 
Eingangsblock von 224 x 224 auf 112 x 112 Pixel verringert. 

An den Eingangsblock angeschlossen sind vier Blöcke mit jeweils drei 
Faltungsschichten: Conv I, II und III. Die Filter haben alle die Dimension 
3 x 3. Während sich die Anzahl der Filter mit jedem Block verdoppelt, 
von 32 bis 256, reduziert sich die räumliche Größe des Bildes von anfangs 
224 x 224 auf7 x 7 Pixel. Anders als beim VGG16-Netz wird dafür kein 
Max Pooling verwendet, sondern die Conv III-Faltungsschichten, deren 
Filter mit einer Schrittweite von 2 (statt wie sonst 1) über die Feature 
Maps der Vorgängerschicht geschoben werden. Diese Methode wurde 
von Springenberg et al. [Spr+15] vorgeschlagen und hat den Vorteil, dass 
das Pooling nicht einfach durch Übernahme eines Maximalwertes erfolgt, 
sondern parametriert werden kann. 

Der Ausgang der letzten Faltungsschicht hat 256 Feature Maps mit den 
Dimensionen 7 x 7. Im VGG16-Netz wird diese letzte Schicht vektori- 
siert und über drei vollständig verbundene Schichten mit den Ausgängen 
verbunden. Dies trägt maßgeblich zur großen Parameteranzahl bei. Hier 
wird Global Average Pooling in Kombination mit einer vollständig ver- 
bundenen Schicht verwendet. Es werden also nicht alle Neuronen der 
letzten Faltungsschicht mit dem Ausgang verbunden, sondern es wird der 
Durchschnitt jeder Feature Map verwendet. Dies führt zu 256 (statt 12544) 
Neuronen, die mit den fünf Ausgängen verbunden werden müssen. Um 
eine Überanpassung des Modells an die Trainingsdaten zu verhindern, 
wurden im Training mittels Dropout 50 % der Neuronen der GAP-Schicht 
ausgeschaltet. 

Eine weitere Änderung gegenüber dem VGG16-Netz ist, dass nicht Re- 
LU sondern PReLU als Aktivierungsfunktion verwendet wird. Dies erhöht 
die Parameteranzahl zwar, verkleinerte den Fehler auf dem Validierungs- 
datensatz aber deutlich. 


92 


5.1 Bildbasierte Modellierung mit neuronalen Netzen 


oS 
gee 
COOP nS 
ADB 
EM 
"Bs 
2 Gasdruck 
Vorschub 
J4 


\ N IR 
Y Y Y 


T 
Block 1 Block2 Block 3 Block 4 


J 


Abbildung 5.1 Architektur des CNNs zur Regression der Prozessparameter. Am Eingang 
wird ein Bild der Schnittkante übergeben. Das Netz besteht aus 13 Faltungsschichten, die in 
vier Blöcken organisiert sind. Die allererste Schicht und die letzte Schicht jedes Blocks (Conv 
II) reduzieren die räumliche Auflösung der Feature Maps jeweils auf ein Viertel. Sie sind 
dunkler dargestellt. Die Anzahl der Feature Maps pro Schicht nimmt mit jedem Block zu. 
Nach den Faltungsschichten bildet Global Average Pooling die 256 Feature Maps auf einen 
256-dimensionalen Vektor ab. Dessen Neuronen werden mit den fünf Ausgängen verbunden. 


Um eine bessere Vergleichbarkeit der fünf Regressionsziele zu erreichen 
und eine Über- oder Unterbewertung einzelner Prozessparameter zu ver- 
meiden, werden diese jeweils auf den Bereich [0, 1] skaliert. Während des 
Trainings wurde der mittlere quadratische Fehler (siehe Formel (3.6)) über 
alle Regressionsziele gemittelt als Verlustfunktion verwendet. 


5.1.2 Klassifikation nach den Faktorstufen eines 
Prozessparameters 


Für die Visualisierung der Zusammenhänge zwischen Schnittkante und 
Prozessparametern mittels LRP werden Klassifikatoren benötigt. Anders 
als bei der Regression, bei der mit einem Modell die Werte fünf verschiede- 
ner Prozessparameter geschätzt wurden, wird ein Modell pro Parameter 
trainiert. Es wird beispielsweise ein CNN trainiert, das ein Bild der Schnitt- 
kante einer der fünf Faktorstufen 13, 17, 21, 25 oder 29 m/min Vorschub 
zuordnet. Dafür wurde die in Tabelle 5.1 gezeigte Architektur wie folgt 
modifiziert: Um anstatt der Regression eine Klassifikation durchzufüh- 
ren, wird eine Softmax-Funktion nach der letzten Schicht eingefügt. Diese 
bildet die Komponenten eines Vektors auf einen Vektor derselben Dimen- 
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Tabelle 5.2 Architektur der CNNs zur Klassifikation nach den Faktorstufen je eines Pro- 
zessparameters basierend auf einem Bild der Schnittkante. B ist die Nummer des Blocks: 
B = {1,2, 3,4}. Nicht eingetragen sind die in jeder Schicht (außer Pooling, GAP, Dropout) 
angewendete Aktivierungsfunktion sowie die Batch-Normalisierung. Diese Operationen 
können für die Visualisierung jedoch als Schichten interpretiert werden. 


Schicht Eingangsgröße Tiefe Ausgangsgröße 
Eingangsblock 224 x 224 32 112 x 112 

B, Conv I 224/2? x 224/2? 162" 904/0” x 224/2” 
B, Conv II 224/2? x 224/2? 16-27 9294/2” x 224/2? 


B, Max Pooling 224/2? x 224/28 16:2? 224/2P+! x 294/924! 
g 


GAP 7 x 7, Tiefe 256 256 
Dropout 256 = 256 
FC, Softmax 256 = Anz. Klassen 


sion ab, dessen Komponenten alle positiv sind und in Summe 1 ergeben 
[Bis06]. Die Ausgangswerte können deshalb als Wahrscheinlichkeiten der 
Zugehörigkeit zur jeweiligen Klasse interpretiert werden. Die PReLU- 
Aktivierungsfunktion wird durch ReLU ersetzt, weil die verwendeten 
Formeln für die LRP dies voraussetzen. Des Weiteren werden die Conv 
III-Faltungsschichten mit der Schrittweite 2 durch Max Pooling ersetzt. 
Diese Änderung dient nicht der Optimierung der Klassifikationsgüte. Die 
Architektur des CNNs wirkt sich aber auch auf das Aussehen der LRP- 
Heatmaps aus und diese waren bei der Verwendung von Max Pooling 
weniger verschwommen. Eine Zusammenfassung der Architektur ist in 
Tabelle 5.2 zu sehen. 

Während des Trainings der Klassifikatoren wurde die kategorische 
Kreuzentropie (siehe Formel (3.9)) als Verlustfunktion verwendet und 
minimiert. 


5.1.3 Schätzung der Rautiefe 


Das CNN für die Schätzung der Rautiefe ist nahezu identisch zu dem 
in Tabelle 5.1 vorgestellten. Es hat jedoch neun (statt fünf) Ausgänge, 
einen für jede der neun Messlinien in verschiedenen Tiefen des Blechs. 
Die in den fünf Bereichen einer Messlinie ermittelten Rz-Werte (siehe 
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Abbildung 4.7) werden dafür gemittelt. Die 15 Bilder einer Kante werden 
mit denselben Rz-Werten gelabelt, da eine separate Messung der Rautiefe 
in jedem Bildbereich aufgrund der zu kleinen Messstrecke unmöglich ist. 

Alle Neuronen verwenden ReLU- statt PReLU-Aktivierungsfunktionen, 
weil das die Anzahl zu trainierender Parameter und damit das Risiko einer 
Überanpassung an einzelne, fehlerhafte Trainingsdatenpunkte verringert. 
Während des Trainings wird der mittlere absolute Fehler (siehe Formel 
(3.7)) statt des mittleren quadratischen Fehlers minimiert. Bei dieser Me- 
trik fallen einzelne große Abweichungen zwischen Vorhersage und Label 
weniger stark ins Gewicht. 


5.1.4 Konfigurationen 


Die hier beschriebenen Konfigurationen betreffen alle oben vorgestellten 
CNNs. 

Die Optimierung der Modellparameter erfolgte mit dem Adam- 
Algorithmus [BK15], welcher eine Weiterentwicklung des Gradienten- 
verfahrens ist. Es wurden die von den Autoren vorgeschlagenen Default- 
Parameter (Lernrate 0,001; 3, 0,9; 8, 0,999) verwendet. 

Um die Speicheranforderungen während des Trainings möglichst gering 
zu halten, wurden die Trainingsbilder in Mini-Batches an das Modell 
übergeben. Ein Batch enthielt 60 Bilder. Batch Normalisierung wurde in 
jeder Faltungsschicht angewendet, um das Trainingstempo zu erhöhen. 

Um Überanpassung zu vermeiden und die Robustheit der Modelle zu 
vergrößern, wurden die Trainingsbilder zufällig horizontal und vertikal 
gekippt und gedreht, bevor sie an das Netz übergeben wurden (engl. onli- 
ne data augmentation). Bei der Drehung der Bilder entstehende leere Pixel 
wurden mit Nullen, die schwarzer Farbe entsprechen, aufgefüllt. Aus dem- 
selben Grund wurde das Training beendet, sobald sich der Validierungs- 
fehler über 20 Epochen (d.h. Iterationsschritte) nicht mehr verkleinerte 
(engl. early stopping). Verbesserte sich der Validierungsfehler beispielswei- 
se zwischen Epoche 27 und 47 nicht weiter, wurde das Training nach 47 
Epochen beendet und die Modellparameter der 27. Epoche gespeichert. 
Die Trainingszeit lag in allen Fällen unter zwölf Stunden und wird im 
Folgenden nicht weiter berücksichtigt. 

Informationen zur verwendeten Hardware und zu den Versionen der 
eingesetzten Python-Bibliotheken sind in Anhang A.1 zu finden. 
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5.1.4.1 Aufteilung der Daten für Training, Validierung und Test 


Die vorhandenen Daten, 50040 Bilder von Schnittkanten (siehe Tabelle 
4.3), wurden in drei Teile geteilt, damit die CNNs trainiert und dann auf 
unbekannten Bildern validiert und getestet werden konnten. Der Trai- 
ningsdatensatz beinhaltete 36060 Bilder. Für die Validierung wurden 6420 
und für das Testen wurden 7560 Bilder verwendet. 

Die 60 Bilder eines Teils (und damit einer Parameterkombination) se- 
hen sehr ähnlich aus. Deshalb muss bei der Aufteilung in Trainings-, 
Validierungs- und Testdaten darauf geachtet werden, dass jede Parameter- 
kombination nur in einem der drei Teile enthalten ist. Sonst könnte es sein, 
dass das CNN die Bilder aus dem Training während des Tests lediglich 
wiedererkennt und man die Modellgüte überschätzt. 

Die Daten wurden dreimal zufällig unter Beachtung der oben beschrie- 
benen Regel aufgeteilt. Die drei Aufteilungen werden im Folgenden mit 
Split 1,2 bzw. 3 bezeichnet. Die zugehörigen Teilmengen der Daten heißen 
Trainings-, Validierungs- und Testset 1, 2 bzw. 3. 


5.2 Visualisierung mit Layer-wise Relevance 
Propagation 


In Abschnitt 3.2.6 befindet sich ein Überblick über die vielfältigen Möglich- 
keiten, komplexe ML-Modelle zu visualisieren und erklärbar zu machen. 
Die Grundidee der in dieser Arbeit genutzten Layer-wise Relevance Propa- 
gation ist es, die Klassifikationsentscheidung eines künstlichen neuronalen 
Netzes in die jeweiligen Beiträge (die sogenannten Relevanzen) der Neu- 
ronen der Eingangsebene zu zerlegen. Die so entstehenden Heatmaps 
haben dieselbe Dimension wie das Eingangsbild. Der Relevanzwert eines 
Pixels zeigt den Beitrag dieses Pixels zum Ausgangswert des Netzes an. 
Im Folgenden wird erklärt, wie die LRP-Regel(n) mithilfe der Deep Tay- 
lor Decomposition (DTD, dt. tiefe Taylor-Zerlegung) hergeleitet werden 
können. Anschließend werden Details zur Implementierung erläutert. 
Vor der formalen Herleitung soll jedoch ein anschauliches Verständnis 
der Methode geschaffen werden. Dazu ist in Abbildung 5.2 ein vollstän- 
dig verbundenes neuronales Netz dargestellt. Normalerweise (siehe dazu 
Abbildung 3.3) werden die Eingangsdaten, z.B. ein Bild, an die Neuronen 
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RY Ris 


Schicht Schicht Schicht Schicht Schicht 
l 1+1 L-1 L 


Ro Re Ry 


Abbildung 5.2 Berechnung des Beitrags jedes Pixels des Eingangsbildes zum Ausgangs- 
wert des neuronalen Netzes mit LRP. Der Ausgangswert wird Schicht für Schicht zurück 
zum Eingang propagiert. Das Ergebnis ist eine Heatmap mit derselben Dimension wie das 
Eingangsbild. Um die Relevanz eines Neurons (im Bild R;—1) der Schicht / zu berechnen, 
müssen die Relevanzwerte aller Neuronen der Schicht l + 1 (im Bild j = {1,2,3,4,5}) 
gewichtet zurück propagiert (im Bild von rechts nach links) und anschließend summiert 
werden. 


der ersten Schicht übergeben und dann wird die Information von Schicht 
zu Schicht weitergegeben bis zum Ausgang. Für die Visualisierung geht 
man anders herum vor. Die Aktivierung eines Ausgangsneurons, z. B. der 
Klasse 13 m/min, wird gewichtet an alle Neuronen der Vorgängerschicht 
übertragen und dann zurück zum Eingang propagiert. Zum Schluss wer- 
den die Aktivierungen auf die Pixel des Eingangsbildes aufgeteilt. 


5.2.1 Deep Taylor Decomposition 


Die Deep Taylor Decomposition ist eine Anwendung der Taylor-Reihe auf 
tiefe neuronale Netze. Ziel dieses Verfahrens ist es, den Funktionswert so 
auf die Eingangsvariablen zu verteilen, dass der jeweilige Anteil gerade 
ihrem Beitrag zum Funktionswert entspricht. Die folgende Herleitung ist, 
sofern nicht anders angegeben, Montavon et al. [Mon+17] entnommen. 
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Ein neuronales Netz (mit einem Ausgang) wird durch eine Funktion 
f: R? — R* beschrieben. Das Funktionsargument æ € Rf ist hier ein (vek- 
torisiertes) Bild mit P Pixelwerten x,, wobei p € {1,2,..., P}. Handelt es 
sich bei dem neuronalen Netz um ein Modell, mit dem Bilder klassifiziert 
werden können, so gibt f die An- oder Abwesenheit eines bestimmten 
Merkmals im Bild an. f(a) = 0 bedeutet, dass das Merkmal nicht vorhan- 
den ist, f(x) > 0 zeigt an, dass (und mit welcher Sicherheit) es vorhanden 
ist. Mit der DTD wird jedem Pixel ein Relevanzwert R,,(a) zugewiesen. 
Die zu einem Eingangsbild gehörenden Relevanzwerte {R,(2)} werden 
als Heatmap bezeichnet. Diese Heatmap hat dieselbe Dimension wie das 
Eingangsbild. Sie soll die folgenden Eigenschaften haben: 


Definition 5.1 (Erhaltend) 
Eine Heatmap {R,(x)} ist erhaltend, wenn die Summe der Relevanzen 
R(x) dem Ausgangswert des Modells Ry entspricht: 
Va: Rs =>), Rp(x) wobei Ry = f(x). 


Definition 5.2 (Positiv) 
Eine Heatmap {R,(a)} ist positiv, wenn alle ihre Werte gleich oder 
größer 0 sind: 
Va,p: R(x) > 0. 


Eine Möglichkeit, den Funktionswert des neuronalen Netzes entspre- 
chend den Definitionen (5.1) und (5.2) in die Beitrage der einzelnen Pixel 
zu zerlegen, stellt die Taylor-Reihenentwicklung dar: 


. 

Ry= sa) = 16) +(F4]__) e-a 61) 
af 

um ae a (5.2) 


Die Reihenentwicklung erfolgt um die Entwicklungsstelle z. Für diese 
soll gelten: f(z) = 0. Terme zweiter und höherer Ordnung n werden nicht 
weiter berücksichtigt. Vergleicht man die Definition (5.1) und die obige 
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Gleichung (5.2), kann man R,,(a) als den Term innerhalb des Summenzei- 
chens identifizieren: 


_ of 


Oxy tg 


R,(2) : Cae (5.3) 
Fir ein gegebenes neuronales Netz f stellt die Wahl der Entwicklungsstelle 
den einzigen Freiheitsgrad dieses Ansatzes dar. Fur sie soll gelten, dass sie 
dem Datenpunkt & (nach einer bestimmten Abstandsdefinition) möglichst 
ähnlich (also nah) sein sollte. Gleichzeitig darf sie gerade die Information 
nicht enthalten, die dazu führt, dass x seiner Klasse zugeordnet wird, da 
gelten soll: f(&) = 0. Anschaulich ist die Differenz zwischen x und & dann 
ein Bild, welches nur noch die Klasseninformation enthält. 

Bei der Berechnung des Gradienten und der Entwicklungsstelle in For- 
mel (5.3) kann wie folgt vorgegangen werden. Ein KNN besteht aus meh- 
reren Schichten, die jeweils mehrere Neuronen enthalten. Im Folgenden 
wird — der Einfachheit wegen - von vollständig verbundenen Schichten 
(siehe Abschnitt 3.2.1.1) ausgegangen: Alle Neuronen {a,}® einer Schicht 
l sind über die Gewichte weit) mit allen Neuronen {a} der darauf 
folgenden Schicht l + 1 verbunden. Für eine bessere Lesbarkeit werden 
die hochgestellten Indizes, die die Zugehörigkeit zur Schicht ausdrücken, 
im Folgenden meist weggelassen. Aktivierungen/Relevanzen/Modell- 
parameter der Schicht | werden stets mit i, Aktivierungen/Relevanzen/ 
Modellparameter der Schicht | + 1 werden mit j indiziert. 

Während des Trainings werden die Modellparameter so angepasst, dass 
der Fehler der Vorhersage am Ausgang auf dem Trainingsdatenset mini- 
miert wird. Dabei wird eine hierarchische Struktur erlernt, z. B. reagiert 
jedes Neuron der ersten Schicht auf eine bestimmte, einfache Struktur 
im Eingangsbild. In tieferen Schichten werden diese einfachen zu immer 
komplexeren Strukturen zusammengesetzt [Arr+16]. 

Die DTD-Methode ist von diesem hierarchischen Prinzip inspiriert. Statt 
das neuronale Netz als Ganzes zu verstehen, betrachtet man wie in Formel 
(3.11) nur die lokale Beziehung der Neuronen {a;} einer Schicht zu einem 
Neuron a, in der darauffolgenden Schicht. 

Unter der Annahme, dass diese beiden Objekte durch eine lokale Funk- 
tion R;({a;}) verbunden sind und dass es eine Entwicklungsstelle gibt, 
für die R,({a,}) = 0 gilt, kann die Taylor-Reihenentwicklung darauf ange- 
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wendet werden, um die Beiträge {R;;} der Neuronen der Schicht ! zum 
Ausgang a, zu ermitteln: 


a; = R,({a;}) (5.4) 
e 
aian 10) 
z (aah a (ta) in ) = (5.5) 
ony ~ (5) 
7 ; 00; lajapai” (a a ) tnj. (5.6) 
=R,; 


Je größer R;; desto wichtiger ist der Beitrag des Neurons i zum Neuron 
j. Es ist zu beachten, dass für jedes Neuron j eine DTD mit einer eigenen 
Entwicklungsstelle { a, ) durchgeführt wird. 

Die Rückpropagation der Relevanz beginnt am Ausgang des Netzes mit 
der Berechnung der Beiträge {R,;} der Neuronen der vorletzten Schicht 
(L—1) zu einem Neuron der Ausgangsschicht (L). Um die Relevanz Schicht 
für Schicht durch das Netz zurück zu propagieren, muss die gesamte 
Relevanz R; eines Neurons der Schicht L — 1 bestimmt werden, damit 
darauf wieder die Taylor-Reihenentwicklung bezüglich der Schicht L — 2 
angewendet werden kann. Dazu werden die Relevanzen R,, aufsummiert: 


RR (5.7) 
j 


Aus der Kombination der letzten beiden Formeln ergibt sich 


OR 


R; = > aa 
j 


Für die Berechnung der Relevanz R; des Neurons i, also seines Beitrags 
zu allen Neuronen der darauffolgenden Schicht, muss j-mal eine DTD 
durchgeführt und die Ergebnisse müssen addiert werden werden. Je nach- 
dem welche Bedingungen für die Entwicklungsstelle gelten, können aus 
5.8 verschiedene Regeln für die Rückpropagation der Relevanz abgeleitet 
werden. 


fa}={a} l (a u a) i (5.8) 
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In einem vollständig verbundenen neuronalen Netz mit ReLU-Akti- 
vierung ist jedes Neuron mit der Vorgängerschicht über 


verbunden. Im einfachsten Fall, wenn jede reelle Zahl ein möglicher Ein- 
gangswert und R, > 0 ist, entspricht die Entwicklungsstelle {a;} dem 
Schnittpunkt der folgenden beiden Ebenen: 


0=) a w,; +, (5.10) 


fay? = {aj} +t: {vj} . (5.11) 


Die erste Gleichung folgt aus Formel (3.11) und der Bedingung, dass 
R,({a;}) = 0 gelten soll. Die zweite beschreibt die Suche nach der Entwick- 
lungsstelle im Eingangsraum des Neurons j. Gesucht wird in Richtung 
fu, }9 ) nach einem Punkt, der dem aktuellen Datenpunkt {a;} nach der 
euklidischen Abstandsdefinition möglichst nah ist. (Falls Rj = Vist, dann 
ist {a;} bereits eine Entwicklungsstelle.) 

Bei einem unbeschränkten Eingangswertebereich gilt hier v; = w,,; und 
t € R. Das bedeutet, dass ausgehend von {a,} in Richtung von {w;;} 
(dem Gradienten von R,) nach der Entwicklungsstelle gesucht werden 
kann. Das Auflösen dieser Gleichungen nach { a, ) und Einsetzen des 
Ergebnisses in Gleichung (5.8) ergibt die LRP-w”-Regel 


2 
weinen, 6.12) 
2 X wi, ; 

Diese erfüllt sowohl die Anforderung der Erhaltung (5.1) als auch die der 
Positivität (5.2). Um die Relevanzen der Eingangspixel R, zu erhalten, 
wird das Netz - gerade umgekehrt wie sonst (Formel 3.11) - Schicht für 
Schicht vom Ausgang zum Eingang durchlaufen. 

Eine detailliertere Herleitung der Formel (5.12) wurde von Montavon 
et al. [Mon+15] publiziert. Je nachdem welche Eingangswerte zugelassen 
sind und wie genau die Entwicklungsstelle gesucht wird, ergeben sich 
von Formel (5.12) abweichende Regeln. Des Weiteren können Modifika- 
tionen vorgenommen werden, die vorteilhafte numerische Eigenschaften 
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aufweisen oder zu einer leichter interpretierbaren (weil z. B. weniger ver- 
rauschten) Heatmap führen. Die Forderungen nach Erhaltung (5.1) und 
Positivität (5.2) müssen dafür teilweise gelockert werden. In dieser Ar- 
beit wurden vier verschiedene Regeln kombiniert, wie es Montavon et al. 
[Mon+19] vorgeschlagen hatten. Dadurch konnte eine möglichst klare und 
gleichzeitig verlässliche Darstellung erreicht werden. Die vier Regeln und 
ihre Kombination sind in Anhang A.4 erläutert. 


5.2.2 Implementierungsdetails 


Bislang wurde die LRP nur für vollständig verbundene Schichten hergelei- 
tet. Indem CNN, dessen Entscheidungen in dieser Arbeit mithilfe der LRP 
visualisiert werden (siehe Abschnitt 5.1.2), werden jedoch verschiedene 
Operationen durchgeführt, die jede für sich als eine Schicht mit einer be- 
stimmten Abbildungsvorschrift interpretiert werden können: vollständig 
verbundene Schicht, Faltungsschichten, Pooling (Global Average Pooling, 
Max Pooling), ReLU-Aktivierungsfunktion, Batch-Normalisierung und 
Softmax. Sie lassen sich alle auf die lineare Abbildung 


at) = 3 at 4 yee (5.13) 


oder auf eine komponentenweise monoton steigende, nicht lineare Abbil- 
dung 
alt) = act (aP) (5.14) 


3 a 


zurückführen [Lap19]. 


Vollständig verbundene Schichten und Faltungsschichten Vollständig 
verbundene Schichten und Faltungsschichten führen eine lineare Abbil- 
dung durch. Bei den Faltungsschichten sind dabei nicht alle Neuronen 
der Schicht | mit allen Neuronen der Schicht | + 1 verbunden. Für einen 
Großteil der Gewichte gilt w;; = 0. w;; # 0 sind die Parameter der Fal- 
tungskerne. Die Adaption der LRP-Regeln auf diese Schichten ist trivial. 
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Pooling-Schichten Bei den Pooling-Schichten wird zwischen Average 
und Max Pooling unterschieden. Ersteres kann als lineare Abbildung mit 
den Gewichten w;; = 1/n interpretiert werden, wobei N der Anzahl der 
zusammengefassten Neuronen entspricht. Bei der Vorwärts-Propagation 
der Aktivierungen wird beim Max Pooling nur die größte Aktivierung 
an die nächste Schicht weitergegeben. Analog dazu könnte die gesamte 
Relevanz bei der Rückpropagation an das maximal aktivierte Neuron 
übertragen werden. In dieser Arbeit wurde jedoch, wie von Montavon 
et al. [Mon+19] vorgeschlagen, die Relevanz wie beim Average Pooling 
auf alle beteiligten Neuronen verteilt. 


Aktivierungsfunktion Bei der ReLU-Aktivierungsfunktion handelt es 
sich um eine nicht lineare Abbildung, die komponentenweise durchge- 
führt wird. Es werden keine Aktivierungen verschiedener Neuronen kom- 
biniert. In diesem Fall gilt: R® = a mit i = j. 

Batch-Normalisierung In jeder BN-Schicht findet eine komponentenwei- 
se Standardisierung der Aktivierungen statt (siehe Formel (3.16)). Die 
Batch-Normalisierung kann in drei Teilschritte zerlegt werden: Subtrakti- 
on VON patch, Skalierung mit XT Baen und Addition von ¢. Daraus ergibt 
sich [Lap19]: 


“(XC Baten)’ le 
a 


RO = mit i =j. (5.15) 


Softmax-Funktion Die Softmax-Funktion wurde bei der LRP, der Emp- 
fehlung von Simonyan et al. [SVZ14] folgend, weggelassen. 


Informationen zu den verwendeten Python-Bibliotheken sind in Anhang 
A.1 zu finden. 
5.2.2.1 Visualisierung der Heatmaps 


Das Ergebnis der LRP ist ein Relevanzwert fiir jedes Pixel und jeden 
Kanal des Eingangsbildes. Die Gesamtrelevanz eines Pixels ergibt sich aus 
der Addition der Relevanzen der einzelnen Kanäle. Die resultierenden 
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P = 224 - 224 Relevanzwerte {R,} werden für die graphische Darstellung 
als Heatmap wie folgt transformiert: 


Ry 
= Y 


+1, 1 3 
Ry = 5 — mit p= 10. (3 5 8,1) (5.16) 
P 


Dadurch werden negative Relevanzwerte auf R; < 0,5, positive Rele- 
vanzwerte auf R, > 0,5 abgebildet. y dient lediglich der Skalierung für 
eine möglichst „schöne“ Darstellung. Deshalb werden negative R,-Werte 
auch auf 0, R,-Werte größer als 1 werden auf 1 gesetzt. Zu beachten ist, 
dass durch dieses Abschneiden vom R,-Wert eines Pixels nur noch einge- 
schränkt auf seinen Anteil am Ausgangswert geschlossen werden kann. 


R,-Werte kleiner als 0,5 werden blau eingefärbt und entsprechen ei- 
nem negativen Beitrag des Pixels (R, < 0), R,-Werte zwischen 0,5 und 1 
werden rot eingefärbt und beschreiben einen positiven Beitrag des Pixels 
(R, > 0) zum Ausgangswert des Netzes. Negativ relevante Pixel beinhal- 
ten Bildmerkmale, die nicht zu der vom Netz angegebenen Klasse passen. 
Dass es überhaupt negative Relevanzwerte gibt, hat mit der Lockerung 
der Positivitäts-Bedingung bei manchen der verwendeten LRP-Regeln 


zugunsten anderer Eigenschaften zu tun (für Details siehe Anhang A.4). 


5.3 Zusammenhang zwischen Parametern und 
Kantenqualität 


Für die Modellierung des Zusammenhangs zwischen den Prozessparame- 
tern und dem Fehlschnittrisiko, der Rautiefe und der Grathöhe wurden 
einfache Modellansätze gewählt. Das Fehlschnittrisiko der Faktorstufe 
eines Prozessparameters ist der Quotient aus der Anzahl der Fehlschnitte 
geteilt durch die Summe aller Schnitte. Das Fehlschnittrisiko wurde mit 
der in Formel (3.4) eingeführten logistischen Regression modelliert, wo- 
bei 1 einem Fehlschnitt und 0 einem erfolgreichen Schnitt entspricht. Für 
die Rautiefe und die Grathöhe wurde der lineare Regressionsansatz (3.3) 
gewählt. 

Die unabhängigen Variablen waren die vier Prozessparameter ADB, Fo- 
kusposition, Gasdruck und Vorschub. Damit nicht nur lineare Zusammen- 
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hänge abgebildet werden können, wurden diese vier Größen polynomial 
erweitert. Dabei entstanden alle Kombinationen der Prozessparameter 
kleiner und gleich dem angegebenen Grad. Bei zwei Eingangsvariablen 
[21,2] würde die Erweiterung zweiten Grades beispielsweise die Varia- 
blen [1, 21, 22,2129, xi, x] ergeben. Nach der polynomialen Erweiterung 
wurden die entstehenden Variablen normiert, um eine Uber- oder Unter- 
bewertung einzelner Einflussfaktoren zu vermeiden. Außerdem wurden 
die Kostenfunktionen durch einen Regularisierungsterm ||w|]3 ergänzt, 
der verhindern sollte, dass einzelne Gewichte zu groß werden. 

Als Label dienten die Klassenzuordnung Fehlschnitt oder erfolgreicher 
Schnitt beziehungsweise die Rautiefen- und Gratwerte. Für die Rautiefe 
wurden vier Modelle trainiert: Rautiefe der Messlinien 03, 15 bzw. 27 und 
gemittelte Rautiefe. Zu jeder Parameterkombination lagen (wegen der 
vier Kanten) mehrere Werte für die Rautiefe und die Grathöhe vor. Die 
zu einer Parameterkombination gehörenden Datenpunkte wurden bei der 
Aufteilung in Trainings-, Validierungs- und Testdaten stets gemeinsam 
einer Teilmenge zugeordnet. Um eine zuverlässigere Aussage über die 
Modellgüte zu erhalten, wurde vierfach kreuzvalidiert. 

Die Modellgüte wurde über Precision und Recall (siehe Abschnitt 3.1.2) 
bzw. den mittleren absoluten Fehler (3.7) beschrieben. Sie wurde jeweils 
für alle Erweiterungen vom Grad 1 bis 7 verglichen. Für die Visualisierung 
der Zusammenhänge wurde je eine polynomiale Erweiterung ausgewählt. 

Zu beachten ist, dass die Datenbasis nicht perfekt ausgeglichen war. 
Ein Ungleichgewicht ergab sich erstens durch die Erweiterung der vier 
vollfaktoriell variierten Prozessparameter durch die Fokusposition (siehe 
Abbildung 4.1(b)). Zweitens veränderten die Fehlschnitte, die nicht für 
alle Faktorstufen gleich wahrscheinlich sind (siehe Abbildung 6.25), die 
Verteilung der Datenpunkte für die Modellierung der Rautiefe und der 
Grathöhe. Drittens kam die LTT-Parameterkombination aufgrund der 
Wiederholung bei jedem 50. Teil besonders oft vor. Um dies zu verhindern, 
wurden alle LTT-Teile bis auf eines aus der Datenbasis entfernt. 

Informationen zu den für die Implementierung genutzten Python- 
Bibliotheken sind in Anhang A.1 zu finden. Alle in diesem Kapitel vorge- 
stellten Modellansätze sind in Tabelle 5.3 zusammengefasst. Die Grundla- 
ge für die Visualisierung mittels LRP bilden die CNN-Klassifikatoren 5.1.2. 
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Tabelle 5.3 Übersicht über die Modellansätze. 
Eingangsdaten Ausgangsdaten Modelltyp 
RGB-Bild Prozessparameter CNN 5.1.1.2 
Hohenbild Prozessparameter CNN 5.1.1.2 
RGBD-Bild Prozessparameter CNN 5.1.1.2 
RGB-Bild Faktorstufen ADB CNN 5.1.2 
RGB-Bild Faktorstufen EM CNN 5.1.2 
RGB-Bild Faktorstufen FP CNN 5.1.2 
RGB-Bild Faktorstufen Gasdruck CNN 5.1.2 
RGB-Bild Faktorstufen Vorschub CNN 5.1.2 
RGB-Bild Rautiefe Mz 03 bis27 CNN 5.1.3 
Prozessparameter Fehlschnittrisiko Log. Regression 5.3 
Prozessparameter Rautiefe Poly. Regression 5.3 
Prozessparameter Grathöhe Poly. Regression 5.3 
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Das Kapitel ist in vier Themenblöcke gegliedert. Zunächst wird die Daten- 
basis vorgestellt und analysiert. Anschließend werden zum Thema Schnitt- 
kantenqualität die Ergebnisse der Expertenbefragung sowie des CNNs zur 
bildbasierten Schätzung der Rautiefe präsentiert und diskutiert. Der dritte 
Teil behandelt die automatisierte Überprüfung des Maschinenzustands 
und die bildbasierte Regression der Prozessparameter. Abschließend soll 
das Verständnis des Laserschneidprozesses erweitert werden. Es wird 
aufgezeigt, wie die Visualisierung der von einem CNN erlernten Muster 
das Prozessverständnis erweitern und in der Praxis unterstützen kann. 
Daran anschließend werden die Zusammenhänge zwischen den Prozess- 
parametern und dem Fehlschnittrisiko, der Rautiefe und der Grathöhe 
analysiert und modelliert. 


6.1 Datenbasis 


In diesem Abschnitt wird die Datenbasis vorgestellt. Ein besonderes Au- 
genmerk wird auf die Datenqualität gelegt und es werden verschiedene 
Ansätze zur Verbesserung derselben evaluiert. 


6.1.1 Fehlschnitte 


Der Versuchsplan zur Generierung der Datenbasis bestand aus 1126 Pa- 
rameterkombinationen, wovon 1050 verschieden waren. Bei den restli- 
chen 76 handelte es sich um zufällige Wiederholungen und um die LTT- 
Parameterkombination (siehe Abschnitt 4.1). 227 der 1126 Teile, also ca. 
20 %, waren Fehlschnitte. Darunter waren 220 verschiedene Parameter- 
kombinationen. Sie konnten nicht aus dem Restgitter entnommen und 
deshalb nicht weiterverwendet werden. Allerdings kann diese Information 
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Tabelle 6.1 Parameterkombinationen, die bei einem Teil zu einem Fehlschnitt führten und 
bei einem anderen Teil das Blech vollständig trennten mit Angabe der Teilenummer bei der 
ein/kein Fehlschnitt (FS) auftrat. 


ADB EM FP Gasdruck Vorschub FS kein FS 
inmm inmm inmm inbar in m/min 

0,5 —3,5 —3,0 9 17 0115 0144 
2,0 —0,5 1,5 21 25 0135 0930 
2,5 —1,5 1,0 15 29 0237 0556 
3,0 —1,0 2,0 15 21 0916 0640 


benutzt werden, um Rückschlüsse auf die Prozessstabilität in Abhängig- 
keit der Prozessparameter zu ziehen. Mehr zu diesem Thema befindet sich 
in Abschnitt 6.4.2. 

In vier Fällen verursachte die gleiche Parameterkombination einmal 
einen Fehlschnitt und einmal trennte der Strahl das Blech vollständig. Die- 
se vier Parameterkombinationen sind in Tabelle 6.1 aufgelistet. Die zweite 
und dritte Parameterkombination weisen einen gegenüber dem LTT-Wert 
erhöhten Vorschub und eine Fokusposition oberhalb des Blechs auf. Die 
erste und vierte Parameterkombination wurden zwar mit kleinen Vorschü- 
ben geschnitten, haben jedoch beide stark vom LTT-Wert abweichende 
Fokuspositionen. 


Diskussion Bei einem hohen Vorschub und/oder bei einer zu hohen 
oder zu tiefen Position des Strahlfokus, wo die Energiedichte maximal 
ist, wird zu wenig Energie in das Blech eingebracht und es entsteht kein 
durchgehender Schnittspalt (mehr dazu in Abschnitt 6.4.2). Vermutlich 
befinden sich diese vier Parameterkombinationen genau an der Grenze 
des schneidbaren Prozessfensters. Deshalb entscheiden kleinste Schwan- 
kungen der Umgebungsbedingungen darüber, ob es zu einem Fehlschnitt 
kommt oder nicht. 


Neben der Anzahl ist die Qualität der Daten für den Erfolg der datenbasier- 


ten Modellierung entscheidend. Diese wird in den folgenden Abschnitten 
für Rautiefe, Rechtwinkligkeitstoleranz und Grathöhe untersucht. 
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6.1.2 Rautiefe 


In Abbildung 6.1 sind die Histogramme der Rautiefenwerte aller Mess- 
linien und jeweils separat für die Messlinien 03, 15 und 27 gezeigt. Zu 
beachten ist, dass die Abszissen jeweils bei 80 um abgeschnitten wurden, 
es jedoch Werte gibt, die größer sind. Für die oberste Messlinie (03) beträgt 
der mittlere Rz-Wert 22 um. Der Median befindet sich relativ weit davon 
entfernt bei 14 um. Bei der mittleren (15) bzw. der untersten Messlinie (27) 
liegen Mittelwert und Median mit 18 und 15 um bzw. 23 und 21 um näher 
beieinander. In den meisten Fällen ist die Rautiefe im oberen Bereich der 
Schnittkante kleiner und nimmt dann über die Mitte nach unten hin zu. 
Gerade im oberen Bereich treten aber auch einige sehr große Rz-Werte auf. 

Die Rautiefenwerte wurden von den Normvorgaben leicht abweichend, 
wie in Abschnitt 4.2.3.1 beschrieben, ermittelt. Für jede Kante erhält man 
45 Rz-Werte, fünf für jede der neun Messlinien in verschiedenen Tiefen 
des Blechs. Die fünf Rautiefenwerte derselben Messlinie auf derselben 
Kante sollten nahezu identisch sein, da für sie alle (bekannten) Einfluss- 
größen übereinstimmen. Diese Annahme wird nun für die Beurteilung der 
Datenqualität bei einmaligem Vermessen aller 3596 Kanten herangezogen. 

In Abbildung 6.2 ist die Verteilung der absoluten (4.3) und der relati- 
ven Differenz (4.4) separat für die Messlinien 03, 15 und 27 ausgewertet. 
Auf den Abszissen ist jeweils der Anteil der Messwerte in % aufgetragen, 
für den die Differenz kleiner oder gleich dem auf der zugehörigen Ordi- 
nate angegebenen Wert ist. Die 100% entsprechen allen 3596 - 5 = 17980 
Messwerten der Messlinie. Idealerweise sollten alle Messwerte eine Dif- 
ferenz von 0 aufweisen. Tatsächlich kommt es aber zu teilweise großen 
Abweichungen. 

Bei Messlinie 03 ist die mittlere absolute Differenz 8 um, die mittlere 
relative Differenz ist 0,5. 10% der Werte haben eine relative Differenz 
größer als 1, sind also mehr als doppelt so groß wie der kleinste Wert in 
derselben Blechtiefe auf derselben Kante. Die mittlere absolute Differenz 
der Messlinie 15 ist 3 um. Die entsprechende relative Differenz ist 0,2. In 
2% der Fälle ist die relative Differenz größer als 1. Bei Messlinie 27 kommt 
es durchschnittlich zu Abweichungen von 3 ym, was einer relativen Diffe- 
renz von ebenfalls 0,2 entspricht. Nur 1% der Werte weisen eine relative 
Differenz größer als 1 auf. Sowohl die absoluten als auch die relativen 
Differenzen sind auf Mz 03 deutlich größer als auf Mz 15 und 27. 
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(c) Rautiefe in der Mitte der Schnittfläche. (d) Rautiefe auf der untersten Messlinie. 


Abbildung 6.1 Verteilung der Rautiefenwerte des ersten Messdurchgangs für alle Messlini- 
en sowie für die oberste (03), die mittlere (15) und die unterste (27) Messlinie. 


Diskussion Vermutlich werden die Unterschiede der Rautiefenwerte 
durch die in Abschnitt 4.2.1.3 thematisierten Messfehler hervorgerufen. 
Ursächlich dafür könnte die hohe Reflektivität der Schnittkanten sein. 
Möglicherweise wird an stark reflektierenden Stellen nur wenig Licht 
in die Kamera gestreut und die Software des VR-3200 interpretiert dies 
fälschlicherweise als tiefe Senke in der Oberfläche. Eine andere Ursache 
für fehlerhafte Höhenwerte könnten Mehrfachreflexionen sein, die zu ei- 
ner fehlerhaften lateralen Verschiebung (4.1) führen. Da der Rz-Wert auf 
der Höhendifferenz zwischen der tiefsten Senke und der höchsten Spitze 
basiert, führen tiefe Senken (und hohe Spitzen) zu sehr großen Rz-Werten. 


In Abbildung 6.3 ist ein Beispiel gezeigt. Es sind jeweils die RGB-Bilder 
und die 3D-Punktwolken der Schnittfläche des ersten und eines zwei- 
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Abbildung 6.2 Verteilung der absoluten (4.3) und der relativen Differenz (4.4) der Rz-Werte 
des ersten Messdurchgangs. 


ten Messdurchlaufs zu sehen. Die RGB-Bilder unterscheiden sich kaum, 
auf die 3D-Punktwolken trifft das nicht zu. Bei der ersten Messung sind 
tiefe Löcher (dunkelblau) im oberen Bereich der Schnittkante zu sehen, 
die bei der Wiederholung nicht auftreten. Die Rz-Werte auf Messlinie 
03 der ersten Messung liegen zwischen 18 und 464 um, die der zweiten 
Messung zwischen 18 und 23 pm, was angesichts der homogenen Schnitt- 
fläche deutlich plausibler ist. In diesem Beispiel ist der oberste Bereich der 
Schnittfläche besonders stark betroffen. Dass das für die gesamte Datenba- 
sis gilt, bestätigt Abbildung 6.2, weil die Abweichungen auf Messlinie 03 
besonders groß sind. Das könnte daran liegen, dass die Kanten im oberen 
Bereich meist sehr glatt sind und daher stärker reflektieren. 


Diskussion Was die Identifikation der Messfehler schwierig macht ist, 
dass es neben den extremen Fällen (wie in Abbildung 6.3) sehr viele Kan- 
ten gibt, bei denen die Rautiefe durch Messfehler weniger stark verfälscht 
wird. Gleichzeitig ist die Bandbreite möglicher Rautiefenwerte im Da- 
tensatz groß, weswegen große Werte nicht zwangsläufig einen Fehler 
bedeuten. Auch innerhalb einer Schnittkante kann es zu Unterschieden 
kommen, wenn beispielsweise dicke Spritzer nur in der Mitte einer sonst 
glatten Kante auftreten. Die Reflexionsproblematik ließe sich möglicher- 
weise durch die Verwendung eines anderen optischen Messverfahrens (z.B. 
konfokales Mikroskop), sicherlich durch die Verwendung eines nicht opti- 
schen Verfahrens verhindern. Ein solches steht jedoch nicht zur Verfügung 
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(c) RGB-Bild, Messung II. (d) 3D-Punktwolke, Messung II. 


Abbildung 6.3 Messfehler durch hohe Reflektivität der Oberfläche, Ausschnitt von Kante 
0703-1. Bei Messung I treten Fehler auf. 


und wäre erheblich langsamer. Eine andere Option wäre die Beschichtung 
der Oberflächen z. B. mit Kreide. Dies kann jedoch ohne Voruntersuchun- 
gen, inwieweit eine solche Beschichtung die aufzunehmenden Riefen 
verschließt, nicht eingesetzt werden. Zweitens soll die Vermessung der 
Schnittkanten in Zukunft mit einem Roboter durchgeführt werden, für 
den das Aufbringen einer gleichmäßigen Kreidebeschichtung eine sehr 
schwierige Aufgabe darstellen würde. Möglicherweise wäre dem Problem 
durch mehrmaliges Einlegen und Messen beizukommen. 


Um abschätzen zu können, wie viele Kanten von den Reflexionsproblemen 
betroffen sind, wurde jede Kante zweimal aufgenommen. Die Durchläufe 
werden mit I und II bezeichnet. 


6.1.2.1 Quantifizierung des Messfehlers 


In Abbildung 6.4 werden die gemessenen Rautiefenwerte von Messung I 
und II miteinander verglichen. Hier werden nicht die fünf Rz-Werte einer 
Messlinie und Kante zueinander in Beziehung gesetzt, sondern es werden 
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(a) Absolute Differenz zwischen Messung I und II. (b) Relative Differenz zwischen Messung I und II. 


Abbildung 6.4 Verteilung der komponentenweisen absoluten und relativen Differenz der 
Rz-Werte zwischen Messdurchgang I und II. 


die Messergebnisse von Durchgang I und II komponentenweise (selbe 
Kante, gleiche Messlinie, gleicher Bereich) verglichen. 

Für 93% aller Messwerte ist die relative Differenz kleiner als 1. Das 
bedeutet umgekehrt, dass es in ca. 7 % der Fälle zu einem Unterschied zwi- 
schen Messung I und II kommt, der größer ist als der kleinere gemessene 
Wert. Ein Messwert, auf den das zutrifft, wird im Folgenden als Ausreißer 
eingestuft. Hier bestätigt sich die oben geäußerte Vermutung, dass im 
oberen Bereich mehr Messfehler auftreten als im mittleren und unteren 
Bereich der Schnittkante, da die Kurve für die Messlinie 03 stets deutlich 
über den anderen liegt. Die relative Differenz ist dort in 15% der Fälle 
größer als 1. 

Würde in beiden Messdurchgängen exakt derselbe Fehler auftreten, 
wäre die Differenz zwischen Messung I und II ebenfalls klein. Bei der 
manuellen Überprüfung einer Stichprobe wurde kein einziger solcher 
Fall entdeckt. Da die Messfehler die Datenqualität deutlich vermindern, 
werden im nächsten Abschnitt drei Methoden zur Korrektur der Fehler 
vorgestellt und bewertet. 


6.1.2.2 Korrektur der Rautiefenwerte 


In diesem Abschnitt werden drei Methoden zur Detektion und Korrektur 
der Messfehler verglichen. Diese wurden ausführlich in Abschnitt 4.3 be- 
schrieben. Die Verteilung der absoluten und der relativen Differenz der 
fünf Rz-Werte auf Messlinie 03 ist in Abbildung 6.5 nach Anwendung 
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Abbildung 6.5 Vergleich der absoluten (4.3) und der relativen (4.4) Differenz der Rz-Werte 
auf Messlinie 03 ohne (Messdurchgang I) und mit einer Korrektur der Messfehler. I & 
II bezeichnet die Korrektur der Fehler durch Kombination der beiden Messdurchgänge. 
Std, MW beschreibt die Korrektur mit dem Mittelwert und AE die Korrektur mit dem 
Autoencoder. Mehr dazu steht in Abschnitt 4.3. 


der verschiedenen Methoden gegenübergestellt. Die Verteilungen bei ein- 
maligem Messen ohne weitere Korrektur, die in Abbildung 6.2 (auch in 
dunkelblau) gezeigt wurden, sind hier nochmal eingetragen. Die relati- 
ve Differenz ist für 10 % der Bereiche größer als 1. Die mittlere absolute 
Differenz beträgt 7,7 um. 


Kombination der Messungen | und Il Die erste Methode zur Verbesse- 
rung der Datenqualität kombiniert die Ergebnisse von Messung I und II. 
Es wurde jeweils der kleinere Wert ausgewählt, weil — wie in den Abschnit- 
ten 4.2.1.3 und 4.2.3.1 erläutert - nur Fälle bekannt sind, in denen es durch 
Messfehler zu einer vergrößerten Rautiefe kommt. Durch die Kombination 
verbessert sich die Kurve hin zu kleineren Differenzen. Lediglich in 2% 
(statt 10%) der Fälle ist die relative Differenz größer als 1. Die mittlere 
absolute Differenz beträgt 2,5 um (statt 7,7 um). Bei der Kombination wer- 
den 51 % der Datenpunkte von Messung I verändert, indem die Werte von 
Durchgang II eingesetzt werden. Die Wahrscheinlichkeit für Messfehler 
scheint in beiden Durchgängen nahezu gleich gewesen zu sein, da die 
Kombination die Ergebnisse von Durchgang I und II zu fast gleichen Teilen 
enthält. Dieser Ansatz ist mit einem erheblichen Mehraufwand verbunden, 
da alle Kanten zweimal vermessen werden müssen. 
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Die anderen beiden Methoden basieren nur auf den Messergebnissen 
des ersten Durchgangs und auf der Annahme, dass die Rz-Werte einer 
Messlinie über alle Bereiche und Kanten eines Teils ähnlich sind. 


Korrektur über Std-Schwellenwert und Mittelwert Bei der Verwendung 
eines festen Schwellenwerts (Summe aus dem Mittelwert und dem 1,7- 
fachen der Standardabweichung der 20 Rz-Werte derselben Messlinie 
eines Teils) und dem Ersetzen aller Werte oberhalb dieser Schwelle mit 
dem neu berechneten Mittelwert reduziert sich der Anteil von Kanten 
mit einer relativen Differenz größer als 1 immerhin auf 7%. Die mittlere 
absolute Differenz reduziert sich von 7,7 auf 5,4 um. Dabei werden 7 % der 
Datenpunkte verändert. 


Korrektur mit einem Autoencoder Die Korrektur mit einem Autoenco- 
der geschieht in zwei Schritten. Zuerst werden alle 180 zu einem Teil 
verfügbaren Rautiefenwerte an den trainierten Autoencoder übergeben. 
Anschließend wird die Repräsentation am Ausgang komponentenweise 
mit dem Eingang verglichen. Ab einer relativen Differenz von 0,35 wird 
der Originalwert durch den vom Autoencoder berechneten Wert ersetzt. 
Nach dieser Korrektur tritt nur noch bei 4% (statt 10 %) der Kanten eine 
relative Differenz größer als 1 auf. Die mittlere absolute Differenz beträgt 
3,5 pm (statt 7,7 um). Mit einem Schwellenwert von 0,35 in Formel (4.5) 
werden ebenfalls 7% der Datenpunkte verändert. 


Diskussion Durch eine andere Wahl der Schwellenwerte kann der Anteil 
korrigierter Werte bei beiden Methoden verändert werden. Die Schwel- 
len wurden jeweils so gewählt, dass ca. 7% der Datenpunkte verändert 
wurden, während 93% unverändert blieben. Diese Aufteilung wurde aus- 
gehend von der Feststellung in Abschnitt 6.1.2.1, dass es in ca. 7 % der Fälle 
zu Ausreißern kommt, festgelegt. Diese Ausreißerdefinition und die Verän- 
derung von nur 7 % der Werte ist ein vorsichtiger, aber bewusst gewählter 
Ansatz. Da die Rz-Werte als Label, also als grundlegende Wahrheit (engl. 
ground truth) für das Modelltraining dienen sollen, ist ihre Veränderung 
durch Algorithmen problematisch. 
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(c) RGB-Bild, Messung II. (d) 3D-Punktwolke, Messung II. 


Abbildung 6.6 Messfehler durch hohe Reflektivität der Oberfläche, Ausschnitt von Kante 
0584-4. Bei Messung I treten Fehler auf. 


Obwohl beide Methoden (Std, MW und AE) gleich viele Datenpunkte 
verändern, erzielt der Autoencoder eine größere Verbesserung der Da- 
tenqualität. Warum die Korrektur mit dem Autoencoder vorteilhafter ist 
und bei welchen Kanten auch diese Methode nicht gut funktioniert, wird 
anhand der folgenden zwei Beispiele erklärt. In der Tabelle 6.2 aufgelistet 
sind die Rz-Messwerte der Kanten 0703-1 und 0584-4 auf Messlinie 03 für 
beide Messdurchgänge und die auf Messung I basierenden Korrekturme- 
thoden. Kante 0703-1 wurde bereits in Abbildung 6.3 gezeigt. Kante 0584-4 
ist in Abbildung 6.6 zu sehen. 

Beim ersten Messdurchgang weisen die Rz-Werte von Kante 0703-1 eine 
Differenz von 446 um zwischen den Bereichen 1 und 4 auf. Beim zweiten 
Messdurchgang sind sowohl die Rz-Werte als auch die Differenzen zwi- 
schen den Bereichen deutlich kleiner. Die Messwerte der Kanten 2,3 und 
4 von Messung I sind ebenfalls aufgelistet. Der Mittelwert der Rz-Werte 
der vier Kanten beträgt 70 um, das 1,7-fache der Standardabweichung ist 
206 um. Rz-Werte oberhalb von 276 pm gelten als Ausreißer. Die Rz-Werte 
464 und 316 um in den Bereichen 1 und 2 werden mit dem neu berechneten 
Mittelwert von 34 pm ersetzt, der Rz-Wert 101 um in Bereich 3 nicht. Ein 
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Tabelle 6.2 Rz-Werte der Messlinie 03 (in um) für zwei verschiedene Kanten, jeweils ohne 
und mit Messfehlerkorrektur. 
Kante Datensatz Mpl Mp2 Mp3 Mp4 ME 


Messung I 464 316 101 18 28 
Messung I 23 17 18 18 21 


ae Std, MW 34 34 101 18 28 
AE 20 19 17 18 28 
0703-2 MessungI 8 8 9 10 8 


0703-3 MessungI 37 11 14 15 210 
0703-4 MessungI 47 27 25 21 20 


MessungI 57 294 278 284 483 
Messung II 29 36 72 63 63 

Std, MW 57 294 278 284 183 
AE 57 158 278 284 284 


0584-4 


potentiell falscher Wert wird also nicht als Ausreißer erkannt, außerdem 
ist der Korrekturwert von 34 um vermutlich immer noch etwas zu groß. 

Mit dem Autoencoder werden die Rz-Werte der Bereiche 1, 2 und 3 ver- 
kleinert. Ihre Größenordnung entspricht dann der des zweiten Messdurch- 
gangs. Die Rz-Werte in Bereich 4 und 5 werden unverändert übernommen, 
weil die vom Autoencoder berechneten Werte nur geringfügig (weniger 
als vom Schwellenwert (4.5) vorgegeben) vom Original abweichen. Bei 
diesem Beispiel ist die Korrektur mit dem Autoencoder sehr erfolgreich. 
Anders sieht es bei Kante 0584-4 aus. Dort werden nur zwei der vermut- 
lich vier falschen Rautiefenwerte mit etwas kleineren Werten ersetzt. Die 
Korrektur mit dem Autoencoder versagt bei sehr inhomogenen, aber größ- 
tenteils rauen Kanten in der direkten Umgebung dicker Spritzer, weil der 
Autoencoder anhand der Muster im näheren Umfeld auf die einzelnen 
Werte schließt. 


Diskussion Zusammenfassend kann gesagt werden, dass die Methode, 
die Messergebnisse mehrerer Durchgänge zu kombinieren, aus Gründen 
des Zeitaufwands nur bedingt empfehlenswert ist, obwohl sie die besten 
Ergebnisse liefert. Die Korrektur der Rz-Werte basierend auf dem Mit- 
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telwert und der Standardabweichung sollte nicht angewendet werden. 
Treten in mehreren Bereichen Fehler auf, führt dies zu einem hohen Mittel- 
wert und zu einer großen Standardabweichung. Ausreißer werden nicht 
erkannt und falls doch, mit einem zu großen Wert ersetzt. Man könnte die 
Schwelle reduzieren, um mehr Datenpunkte als Ausreißer zu klassifizieren, 
aber dies würde einen größeren Anteil der originalen Daten verändern. 
Die Robustheit des Verfahrens zu erhöhen, indem nicht nur über die 20 
Rz-Werte einer Messlinie, sondern über alle 180 Werte eines Teils gemittelt 
wird, ist nicht ratsam, da die Rautiefe in verschiedenen Tiefen des Blechs 
sehr unterschiedlich sein kann. Die verschiedenen horizontalen Schichten 
sind ein charakteristisches Merkmal von Laserschnittkanten [SM10], das 
nicht heraus gemittelt werden darf. Die Korrektur mit dem Autoencoder 
funktioniert besser. Hierfür werden nicht nur die 20 Werte einer Messlinie 
verwendet, sondern alle neun Messlinien. Der Autoencoder mittelt jedoch 
nicht einfach, sondern erlernt die typischen Muster der Schnittkanten und 
die Relationen der einzelnen Datenpunkte zueinander. Wie das Beispiel 
von Kante 0584-4 zeigt, funktioniert auch diese Methode nicht perfekt, 
aber sie reduziert die Messfehler deutlich und lässt dabei 93% der Daten 
unverändert. Allerdings sollte ein zentraler Kritikpunkt des Autoencoders 
nicht unterschlagen werden: Es ist - im Gegensatz zu den anderen beiden 
Methoden - nicht klar, welche Muster und Beziehungen der Datenpunkte 
für die Rekonstruktion genutzt werden. 


6.1.2.3 Zusammenfassung 


Aus der aufgenommenen 3D-Punktwolke einer Schnittkante wurden 45 
Rz-Werte extrahiert. Diese Werte sind fehlerbehaftet. Dies äußert sich in 
zu großen Rz-Werten. Besonders häufig ist dabei der oberste Bereich der 
Schnittkante betroffen. Eine zuverlässige Detektion dieses Fehlers ist sehr 
schwierig. Methodisch am einfachsten lässt sich die Datenqualität durch 
mehrmaliges Messen und die Kombination der Ergebnisse verbessern. Am 
zweitbesten funktioniert die Korrektur mit einem Autoencoder. 

Die originalen bzw. korrigierten Rautiefenwerte der fünf Bereiche einer 
Messlinie werden für die weitere Verwendung gemittelt. Damit liegt pro 
Kante in jeder Blechtiefe genau ein Rautiefenwert vor. Im Folgenden wer- 
den - sofern nicht anders angegeben - die kombinierten Messdaten der 
Durchgänge I und II als beste vorhandene Datenbasis genutzt. 
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Abbildung 6.7 Verteilung der Werte von Rechtwinkligkeitstoleranz und Grathöhe im ge- 
samten Datensatz des ersten Messdurchgangs. 


6.1.3 Rechtwinkligkeitstoleranz 


Die Rechtwinkligkeitstoleranz ist neben der Rautiefe die zweite in der 
Norm DIN EN ISO 9013 [Deu17] genannte Größe zur Beschreibung der 
Qualität einer Laserschnittkante. Sie wurde ebenfalls aus der 3D- 
Punktwolke der Schnittfläche abgeleitet und in fünf Bereichen gemes- 
sen (siehe Abschnitt 4.2.3.2). Die Messlinien verlaufen dabei orthogonal 
zu denen der Rautiefe. In Abbildung 6.7(a) ist ein Histogramm aller Werte 
des Datensatzes zu sehen. Der Mittelwert beträgt 35 um und der Median 
ist 34 um, was bereits auf eine - verglichen mit der Rautiefe — geringere 
Ausreißerproblematik hindeutet. Abbildung 6.8 zeigt die Auswertung 
der Datenqualität — analog zur Rautiefe - über die Verteilung der abso- 
luten und der relativen Differenz der fünf Messwerte einer Kante zum 
jeweiligen Minimum. Die Abweichung eines Messwertes zum kleinsten 
Wert derselben Kante ist durchschnittlich 2 ym, das entspricht einer rela- 
tiven Differenz von 0,07. Weniger als 1% der Werte weisen eine relative 
Differenz größer als 1 auf. 


Diskussion Die Datenqualität ist besser als bei der Rautiefenmessung, 
obwohl dieselben 3D-Punktwolken als Grundlage dienen. Da die fünf 
Messlinien aber kürzer sind und nicht entlang der Kante verlaufen, ist die 
Wahrscheinlichkeit, dass eine Messlinie einen Fehler beinhaltet, kleiner. 
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Abbildung 6.8 Verteilung der absoluten und der relativen Differenz (analog zu den Formeln 
(4.3) und (4.4)) der u-Werte für den ersten Messdurchgang. 


6.1.4 Grathöhe 


Die Grundlage für die Berechnung der Gratmerkmale bilden die aus der in 
Abbildung 4.4(d) gezeigten Perspektive aufgenommenen 3D-Punktwolken 
der Blechunterseite. In Abbildung 6.7(b) ist ein Histogramm der Grathö- 
henwerte im gesamten Datensatz gezeigt. Die durchschnittliche Grathöhe 
beträgt 104 um, der Median liegt mit 59 ym deutlich darunter. Da, anders 
als bei Rautiefe und Rechtwinkligkeitstoleranz, nicht pauschal davon aus- 
gegangen werden kann, dass Messfehler zu vergrößerten Werten führen, 
kann das Minimum nicht als verlässlichster Wert gelten. Deshalb sind in 
Abbildung 6.9 die absolute und die relative Differenz der fünf Messwerte 
jeder Kante bezüglich des jeweiligen Medians aufgetragen. Die mittlere 
absolute Differenz ist 15 um, die mittlere relative Differenz beläuft sich auf 
0,2. In 3% der Bereiche ist die relative Differenz größer als 1. 

Auch wenn ein direkter Vergleich mit der Messqualität der Rautiefen- 
messung schwierig ist, weil die Messwerte dort mit dem jeweils kleinsten 
und nicht mit dem Median verglichen werden, zeigt diese Auswertung, 
dass auch beim Grat Unterschiede entlang einer Kante auftreten. Um zu 
überprüfen, ob diese durch Messfehler hervorgerufen werden, werden die 
Messdurchgänge I und II im Folgenden miteinander verglichen. 
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Abbildung 6.9 Verteilung der absoluten und der relativen Differenz der Grathöhen der 
Bereiche 1 bis 5 der jeweils selben Kante bezüglich des Medians. 


6.1.4.1 Quantifizierung des Messfehlers 


Analog zur Quantifizierung des Messfehlers bei der Rautiefe (siehe Ab- 
bildung 6.4) sind in Abbildung 6.10 die komponentenweise absolute und 
relative Differenz der Messwerte von Messdurchgang I und II gezeigt. In 
weniger als 3% der Fälle unterscheiden sich die Grathöhen der beiden 
Messdurchgänge um mehr als das doppelte des kleineren Werts. Das ist 
ein viel kleinerer Anteil als bei der Rautiefenmessung. Dort waren es z.B. 
15 % auf Messlinie 03. 

Eine stichprobenartige Überprüfung von Kanten mit großen Unterschie- 
den ergab verschiedene Ursachen. Zum einen werden Abweichungen 
zwischen den beiden Messdurchgängen durch die Aufbewahrung und 
Handhabung der Proben verursacht, z. B. durch kleine Staubpartikel oder 
abgebrochene Gratperlen. Zum anderen treten auch hier sehr vereinzelt 
Messprobleme auf. Beispielsweise kommt es vor, dass der Grat aufgrund 
der geringen Tiefenschärfe von +0,5 mm und der automatischen Fokussie- 
rung nicht korrekt abgebildet wurde. 

Die Unterschiede der Grathöhe zwischen den verschiedenen Bereichen 
derselben Kante werden oft durch Prozessstreuungen und nur selten durch 
Messfehler hervorgerufen. Ein Beispiel dafür sind dicke Spritzer an der 
Unterseite der Kanten 2 oder 4. In der Laserschneidmaschine liegt das 
Blech auf Stegen auf (siehe Abschnitt 4.1.2). Befindet sich der Schnittspalt 
direkt über einer Stegspitze, kann das flüssig gewordene Material nicht 
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Abbildung 6.10 Verteilung der komponentenweisen absoluten und relativen Differenz der 
Grathöhenwerte zwischen Messdurchgang I und II. 


wie sonst aus dem Schnittspalt ausgetrieben werden. Dadurch werden, 
wie in den Abbildungen 6.11(a) und 6.11(b) gezeigt, sehr große Spritzer 
an der Blechunterseite hervorgerufen. Solche, durch Spritzer verfälschte 
Gratbereiche können mithilfe einer einfachen Ausreißerdetektion erkannt 
und entfernt werden, da an diesen Stellen sowohl Höhe als auch Breite des 
Grats um ein Vielfaches größer sind als in den anderen Bereichen. Zudem 
kann ein Spritzer in maximal zwei (benachbarten) Messbereichen auftre- 
ten, weil die Länge der vermessenen Kante kleiner ist als der Abstand 
zweier Stege. Große Differenzen zwischen den fünf Messbereichen treten 
außerdem bei Kanten auf, wie der in den Abbildungen 6.11(c) und 6.11(d) 
gezeigten. Der Grat dieser Kante besteht aus einzelnen Perlen, die sehr 
weit voneinander entfernt sind. Die Ursache dafür ist unklar. 

Wenn man die Grathöhen der fünf Messbereiche zusammenfasst, liegt 
zu jeder Kante eine Grathöhe vor. Auffällig ist, dass es bei manchen Teilen 
zu erheblichen Unterschieden zwischen den vier Kanten desselben Teils 
kommt. Während auf einer Kante nahezu kein Grat vorhanden ist, sind auf 
einer anderen Kante dicke Tropfen an der Blechunterseite haften geblieben. 
Ein extremes Beispiel dafür ist Teil 0610. Die Grathöhe von Kante 2 (siehe 
Abbildung 6.11(e) und 6.11(f)) beträgt — gemittelt über die fünf Bereiche — 
154 um, die von Kante 4 (siehe Abbildung 6.11(g) und 6.11(h)) nur 10 um. 
Diese beiden Kanten wurden mit denselben Parametern geschnitten. Es 
könnte also sein, dass es eine weitere Einflussgröße auf die Grathöhe gibt, 
die bislang nicht betrachtet wurde und die sich stärker auf den Grat als 
auf die Schnittfläche auswirkt, bei der solche Unterschiede nicht auftre- 
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(c) Kante 0446-2, RGB-Bild. (d) Kante 0446-2, 3D-Punktwolke. 
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(e) Kante 0610-2, RGB-Bild. (f) Kante 0610-2, 3D-Punktwolke. 
Höhe in um 
— 1mm PO C A 


(g) Kante 0610-4, RGB-Bild. (h) Kante 0610-4, 3D-Punktwolke. 


Abbildung 6.11 RGB-Bilder und 3D-Punktwolken ausgewählter Kanten. Bei 0407-2 werden 
die Grathöhe und -breite durch einen dicken Spritzer verfälscht. Der Grat von Kante 0446-2 
hat einzelne Perlen, die ungleichmäßig verteilt sind. Die Kanten 2 und 4 von Teil 0610 weisen 
sehr unterschiedliche Gratausprägungen auf. 
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ten. Deshalb wurde untersucht, ob ein systematischer Zusammenhang 
zwischen der Grathöhe und einer der folgenden Einflussgrößen besteht: 


= Schnittrichtung 

= Walzrichtung 

= Blechtafel 

= Position auf dem Blech (Zeilen, Spalten, siehe Abbildung 4.2(b)) 
= Zeitpunkt des Schneidens, Maschinenlaufzeit 

= Prozessparameter. 


Eine eindeutige Einflussgröße konnte nicht identifiziert werden. Details 
der Analyse sind in Anhang A.5 zu finden. 


6.1.4.2 Zusammenfassung 


Aus der 3D-Punktwolke des Grats wurde die Grathöhe pro Kante in fünf 
Bereichen ermittelt. Während bei der Rautiefe Messfehler zu großen Streu- 
ungen der Rz-Werte führen, stellt die Messqualität bei der Gratmessung 
ein kleineres Problem dar. Es kommt dennoch - prozessbedingt - zu 
großen Unterschieden der Grathöhe entlang einer Kante, aber vor allem 
zwischen den vier Kanten desselben Teils. Die Ursache dafür konnte nicht 
eindeutig ermittelt werden. Deshalb wäre es denkbar, dass eine nicht er- 
fasste Einflussgröße verantwortlich ist. Tritt der Laserstrahl nicht stabil 
im Zentrum der Düse aus dem Schneidkopf aus, sondern verändert seine 
Position, könnte dies beispielsweise die Grathöhe beeinflussen. Vermut- 
lich würde eine größere Datenbasis in Kombination mit der Erfassung 
weiterer Einflussgrößen (z. B. Strahlzentrizität, exakte Position der Kanten 
bezüglich der Stegspitzen) helfen, die Ursache zu identifizieren. 

Dass keine klaren Zusammenhänge zwischen dem Grat und den im 
vorigen Abschnitt genannten Einflussgrößen gefunden werden konnten, 
stellt für die Modellierung ein großes Problem dar. Für die eindeutige 
Zuordnung eines Teils (bzw. einer Parameterkombination) zu einer Grat- 
höhe sollten die vier Kanten ähnliche Grathöhen aufweisen, was nicht der 
Fall ist. Deshalb sind die Ergebnisse eines Modells für eine einzelne Kante 
später nur begrenzt aussagefähig. 
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Da die Gratbreite stark mit der Grathöhe korreliert (Korrelationskoeffi- 
zient 0,7), lassen sich die Ergebnisse näherungsweise auf die Gratbreite 
übertragen. Darauf wird nicht weiter eingegangen. 


6.2 Qualitätsbeurteilung 


Eine objektive, überall anwendbare Qualitätsdefinition ist für die Formu- 
lierung individueller Anforderungen unabdingbar. Trotz existierender 
Normvorgaben wird die Schnittkantenqualität in der Praxis subjektiv 
von Einzelpersonen beurteilt. Im nächsten Abschnitt wird dieses Vorge- 
hen kritisch hinterfragt und es wird untersucht, welche Merkmale der 
Schnittkante die subjektive Einschätzung des Menschen beeinflussen. An- 
schließend wird vorgestellt, wie die wichtigste Normgröße, die Rautiefe, 
mithilfe eines CNNs basierend auf einem Foto der Schnittkante geschätzt 
werden kann. Damit kann die menschliche Bewertung durch eine objek- 
tive Größe ergänzt werden, ohne dass ein teures Messgerät erforderlich 
ist. 


6.2.1 Expertenbefragung 


Fünf Experten (E1, E2, E3, E4 und E5) haben 100 Schnittkanten innerhalb 
von drei Wochen bewertet. In jeder Woche mussten sie die Qualität von 40 
Kanten, jeweils separat für die Schnittfläche und den Grat, mit Schulnoten 
bewerten. Zehn der Kanten waren ohne das Wissen der Befragten in jeder 
Woche dieselben. In Abbildung 6.12 ist für jede der sechs Qualitätsstufen 
eine exemplarische Schnittfläche gezeigt. Zusätzlich zum Median sind die 
von den Einzelpersonen vergebenen Noten angegeben. 

Die mit sehr gut bewertete Kante weist eine homogene, glatte Schnitt- 
fläche mit fast senkrechten Riefen auf. Die mit gut bewertete Kante un- 
terscheidet sich davon nur durch kleinere Spritzer im mittleren Bereich. 
Die Riefen der mit Note 3 und 4 beurteilten Kanten verlaufen schräger, 
die Rauheit nimmt vor allem im unteren Bereich zu. Dadurch wirken die 
Kanten deutlich inhomogener. Die mit der Note 4 bewertete Kante ist 
zusätzlich an der Unterkante verfärbt. Ausgeprägte horizontale Schichten 
und dicke Spritzer sind auf den beiden schlecht bewerteten Kanten zu 
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(e) Kante 0575-1, Note 5 (4, 5, 5, 6, 6). (f) Kante 0727-1, Note 6 (5, 6, 6, 6, 6). 


Abbildung 6.12 Beispiele für Schnittflächen verschiedener Qualitätsstufen. Zu jeder Kante 
sind der Median der fünf Bewertungen sowie die Noten der Einzelpersonen angegeben. 


finden. Diese Merkmale sind bei der mit der Note 6 beurteilten Kante noch 
ausgeprägter als bei der Kante mit Note 5. 

Um zu beurteilen, wie gut/schlecht eine Einzelperson für eine reprä- 
sentative Beurteilung der Qualität geeignet ist, ist in Abbildung 6.13 die 
Verteilung der maximalen Differenz, also der Differenz zwischen schlech- 
tester und bester der fünf vergebenen Bewertungen derselben Kante, ge- 
zeigt. Bei lediglich einer Kante haben alle Experten dieselbe Note für die 
Schnittfläche vergeben. In den meisten Fällen kommt es zu Abweichungen 
von ein bis zwei Notenpunkten. Bei einem Drittel der Schnittflächen liegen 
die Bewertungen jedoch um drei bis vier Schulnoten auseinander. Für 
die Schnittfläche der Kante 0298-1 (siehe Abbildung 6.14(a)) vergaben die 
Experten die Noten 5, 5, 2, 2 und 6. Als Hauptgrund ihrer Bewertung 
nannten alle die Verfärbung/Oxidation des unteren Kantenbereichs. Die 
Schnittfläche der Kante 0857-1 (siehe Abbildung 6.14(b)) wurde mit 5, 4, 3, 
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Abbildung 6.13 Verteilung der maximalen Differenz der fünf Expertenbewertungen dersel- 
ben Kante. 


— 1mm 


(a) Kante 0298-1, Noten: 5, 5, 2, 2, 6. (b) Kante 0857-1, Noten: 5, 4, 3, 6, 6. 


Abbildung 6.14 Beispiele für Schnittkanten mit stark abweichenden Bewertungen der 
Schnittfläche. 


6 und 6 bewertet. Die genannten Gründe beziehen sich alle auf die Rauheit 
der Kante. Beim Grat fallen die Beurteilungen einheitlicher aus. In 93 % 
der Fälle beträgt die Abweichung zwei oder weniger Notenpunkte. 


Diskussion Differenzen von ein bis zwei Noten sind unproblematisch, 
da eine Differenzierung in sechs verschiedene Qualitätsklassen in der 
Praxis oft nicht erforderlich ist. Unterschiede von drei oder mehr Noten- 
stufen bedeuten jedoch, dass die Qualitätseinschätzungen verschiedener 
Personen stark voneinander abweichen. An den beiden Beispielen mit sehr 
unterschiedlichen Bewertungen zeichnet sich bereits ab, was sich später 
bestätigen wird: Die Experten nehmen dieselben Merkmale wahr, aber sie 
gewichten diese unterschiedlich und kommen so zu einer abweichenden 
Einschätzung der Qualität. Die Beurteilungen des Grats fallen vermutlich 
einheitlicher aus, weil diese Struktur deutlich weniger komplex ist. Ein 
niedriger Grat wird positiv, ein hoher Grat negativ bewertet. 
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Tabelle 6.3 Maximale Notendifferenz bei der Bewertung der jeweils selben Kante durch 
dieselbe Person in drei verschiedenen Wochen. Für jede Kante wurde in jeder Woche au- 
ßerdem der Median der fünf Bewertungen ermittelt. Dessen Schwankungen über die drei 
Wochen sind in der Tabelle ebenfalls angegeben. 


Differenz El E2 E3 E4 E5 Median 

0 3 3 3 3 3 4 

1 3 4 4 6 3 6 
Fläche 2 4 2 1 1 1 0 

3 0 1 2 0 2 0 

4 0 0 0 0 1 0 

0 1 1 2 4 3 2 
Grat 1 6 4 7 5 0 6 

2 3 5 1 1 7 2 


Die Bewertungen einer Schnittkante hängen nicht nur von der bewerten- 
den Person, sondern auch von ihrer individuellen Tagesform ab. Dies 
lässt sich anhand der zehn wiederholt bewerteten Kanten feststellen, für 
die drei Bewertungen der Schnittfläche und des Grats von jeder Person 
vorliegen. In Tabelle 6.3 ist aufgelistet, wie oft sich die Bewertungen der- 
selben Kante um null, eine, zwei oder drei Notenstufen unterscheiden. Bei 
zwei der fünf Personen kommt es bei der Beurteilung der Schnittfläche zu 
Abweichungen von drei, bei einer Person sogar von vier Notenstufen. Eine 
Abweichung von 3 bedeutet beispielsweise, dass von derselben Person in 
einer Woche die Note 2 und in einer anderen Woche für dieselbe Kante eine 
5 vergeben wurde. So große Abweichungen treten bei der Gratbewertung 
nicht auf. 


Fazit Es zeigt sich, dass einzelne Personen aufgrund ihrer individuellen 
Präferenzen und Tagesform nur bedingt in der Lage sind, eine zuverlässige, 
reproduzierbare und repräsentative Einschätzung der Schnittflächenquali- 
tät vorzunehmen. Entweder ermöglicht man es also, individuelle Quali- 
tätspräferenzen anzugeben und passt die Prozessparameter entsprechend 
an (mehr dazu in Abschnitt 6.4.5), oder man verwendet einen Durch- 
schnittswert, der die Einschätzung mehrerer Personen wiedergibt. 
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Dafür wird nun der Median der zu jeder Kante vorliegenden Bewertun- 
gen genutzt. Tabelle 6.3 zeigt, dass der Median relativ stabil ist. Bei der 
Schnittfläche schwankt er zwischen den drei Wochen um maximal einen 
Notenpunkt, beim Grat in den meisten Fällen ebenfalls. Nur bei zwei 
von zehn Kanten kommt es zu einer Abweichung um zwei Notenpunk- 
te. Vergleicht man die Bewertungen der einzelnen Experten für alle 100 
bewerteten Schnittflächen mit dem jeweiligen Median, zeigt sich, dass sie 
verschieden kritisch sind. Die Experten 1 und 5 vergeben durchschnittlich 
schlechtere Noten als die anderen. E1 vergab 33-mal eine schlechtere und 
nur 12-mal eine bessere Note als der Median. E5 bewertete 32 Kanten 
schlechter und nur 10 Kanten besser. Bei E2 halten sich die besseren (26) 
und die schlechteren (20) Bewertungen die Waage. Die Experten 3 und 4 
sind weniger kritisch. E3 bewertete 31 Kanten besser und 15 schlechter als 
der Median, E4 beurteilte 49 Kanten besser und 14 Kanten schlechter. Bei 
der Bewertung des Grats ist die Tendenz dieselbe. 

Zusätzlich zu den Noten liegen zu 70 Kanten die Einschätzungen jedes 
Experten für fünf Merkmale der Schnittfläche vor. Diese sind: Rauheit, 
Rechtwinkligkeit, Verfärbung, Homogenität und Anschmelzung der Ober- 
kante. Die Experten bewerteten jeweils, ob ihnen dieses Merkmal gut, 
mittelmäßig oder schlecht gefiel. Um einen Einblick in die individuelle 
Gewichtung dieser fünf Merkmale zu erhalten, soll für jeden Experten 
quantifiziert werden, wie sich seine Wahrnehmung der Merkmale auf die 
Note auswirkt. Dafür sind in Tabelle 6.4 die Korrelationen zwischen der 
Note der Schnittfläche und der Beurteilung der Einzelkriterien dargestellt. 
Besonders interessant ist der Vergleich der Experten E1 und F4. Während 
für El alle Kriterien bis auf die Verfärbung relevant sind, sind für E4 ledig- 
lich die Rauheit und die Homogenität von Bedeutung. Vermutlich kommt 
E1 deshalb oft zu schlechteren, E4 oft zu besseren Bewertungen als der 
Durchschnitt. Die Rauheit und die Homogenität sind für alle fünf Perso- 
nen wichtig, die Rechtwinkligkeit scheint nur für El eine Rolle zu spielen. 
Die Verfärbung gewichten die Experten E2 und E5 stärker als die anderen, 
bei der Beschaffenheit der Oberkante trifft das auf E1 und E3 zu. Durch 
die individuelle Gewichtung der einzelnen Merkmale kommen die fünf 
Personen zu sehr unterschiedlichen Ergebnissen in der Gesamtbewertung. 
Kante 0298-1 (siehe Abbildung 6.14(a)) wird von allen Experten als verfärbt 
wahrgenommen. Da dieses Merkmal für E3 und E4 irrelevant ist, geben 
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Tabelle 6.4 Pearson-Korrelationskoeffizienten zwischen Schulnotenbewertung der Schnitt- 
fläche und der Beurteilung von fünf Einzelmerkmalen: Rauheit, Rechtwinkligkeit, Verfär- 
bung, Homogenität und Anschmelzung der Oberkante. Ergänzend sind die Korrelationskoef- 
fizienten mit der gemessenen, durchschnittlichen Rautiefe und der Rechtwinkligkeitstoleranz 
(u) dargestellt. In der letzten Zeile stehen die Korrelationskoeffizienten zwischen der Schul- 
notenbewertung des Grats und der gemessenen Grathöhe. 


Einzelkriterien El E2 E3 E4 E5 


Rauheit 06 07 07 08 06 
Rechtwinkligkeit 05 03 - 0,0 02 
Verfärbung 02 04 00 01 04 
Homogenität 06 07 07 08 06 
Oberkante 05 - 04 01 03 
Rautiefe 05 05 07 08 06 
u 03 03 06 06 04 
Grathöhe 08 07 09 08 08 


sie die Note 2, während die anderen die Note 5 oder 6 vergeben. Ebenfalls 
in der Tabelle 6.4 abzulesen sind die Korrelationskoeffizienten zwischen 
der Note und der gemessenen (über alle Messwerte der Kante gemittelten) 
Rautiefe bzw. der gemessenen Rechtwinkligkeitstoleranz. Die Korrelation 
zwischen Note und wahrgenommener Rauheit ist in zwei Fällen größer als 
die zwischen Note und gemessener Rautiefe, in drei Fällen gleich. Abwei- 
chungen könnten daran liegen, dass es sich bei der gemessenen Rautiefe 
hier lediglich um einen Mittelwert handelt, der Unterschiede innerhalb 
einer Kante unzureichend wiedergibt. Dass die Korrelation zwischen der 
Note und der gemessenen Rechtwinkligkeitstoleranz ausgerechnet bei den 
Experten am größten ist, denen die wahrgenommene Rechtwinkligkeit 
am wenigsten wichtig ist (E3, E4), kann anhand dieser Daten nicht erklärt 
werden. In der letzten Zeile der Tabelle 6.4 stehen die Korrelationskoeffi- 
zienten zwischen Gratnote und gemessener Grathöhe. Hier gibt es einen 
sehr eindeutigen Zusammenhang: Die Korrelationskoeffizienten liegen 
zwischen 0,7 und 0,9. 

Zuletzt wird untersucht, wie die Qualität mit den Kosten eines Teils 
zusammenhängt. Da die Kosten hauptsächlich vom Vorschub (Zeit) und 
vom Gasdruck (Gasverbrauch) abhängen, werden in Abbildung 6.15 die 
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guten Kanten hinsichtlich dieser Parameter mit allen bewerteten Kanten 
verglichen. Wie man sieht, wurden die meisten guten Kanten mit einem 
gegenüber der LTT erhöhten Vorschub und verringerten Gasdruck ge- 
schnitten. Die einzige Kante, welche sowohl für die Schnittfläche als auch 
für den Grat die Bestnote erhalten hat, ist die Kante 0275-1 (siehe Abbil- 
dung 6.12(a)). Sie wurde mit einem Vorschub von 25 m/min und einem 
Gasdruck von 18 bar geschnitten. Die Experten bewerteten auch die Kante 
0401-1, die mit LTT-Parametern geschnitten wurde. Sie erhielt die Noten 2 
(Schnittfläche) und 3 (Grat). 


Diskussion Durch eine Erhöhung des Vorschubs gegenüber dem LIT- 
Wert könnten sowohl die Produktivität gesteigert als auch die Qualität 
verbessert werden. Bei der Wahl der LIT-Parameter geht es jedoch nicht 
nur um die Maximierung der Qualität, sondern auch darum ein besonders 
stabiles Prozessfenster zu finden, damit es in der industriellen Anwendung 
keinesfalls zu Fehlschnitten kommt. Dafür nimmt man bewusst eine Ver- 
ringerung der Produktivität und eine Verminderung der Qualität in Kauf. 
Bislang werden Produktivitätssteigerungen vor allem durch immer höhere 
Laserleistungen erzielt, was mit einem großen Entwicklungsaufwand ein- 
hergeht. Eine Verbesserung der Kontrollierbarkeit des Gesamtprozesses 
würde hier neue Möglichkeiten eröffnen, die Produktivität zu erhöhen. 


In der Tabelle 2.1 sind die Qualitätsklassen thermisch geschnittener Kanten 
anhand der maximalen Rautiefe und Rechtwinkligkeitstoleranz definiert. 
Eine Kante der Dicke 3mm ist bei einem Rautiefenwert unterhalb von 
11,8 pm der Klasse 1 zuzuordnen. Für Qualitätsklasse 2 darf die Rautiefe 
42 um nicht überschreiten. Keine der im Rahmen der Expertenbefragung 
insgesamt mit gut bewerteten Kanten erfüllt die Kriterien von Klasse 1 
hinsichtlich der Rautiefe, was beim Laserschneiden eines Edelstahlblechs 
dieser Dicke mit einem Festkörperlaser auch zu erwarten ist. Die Wer- 
te liegen zwischen 15 um (Kante 0631-1) und 38 um (Kante 0314-1) und 
damit in Klasse 2. Für eine Zuordnung zu Klasse 1 muss die Rechtwink- 
ligkeitstoleranz kleiner als 59 um sein. Diese Bedingung erfüllen alle gut 
beurteilten Kanten mit Werten zwischen 7 um (Kante 1040-1) und 58 um 
(Kante 1013-1). 
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Häufigkeit 
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(a) Häufigkeit der Vorschubstufen jeweils für alle (b) Häufigkeit der Gasdruckstufen jeweils für alle 
Kanten (ges.) und die mit gut bewerteten Kanten. Kanten (ges.) und die mit gut bewerteten Kanten. 
Der LTT-Wert ist 21 m/min. Der LTT-Wert betragt 15 bar. 


Abbildung 6.15 Zusammenhang zwischen der Note und den Parametern Vorschub und 
Gasdruck. Bei den guten Kanten wurden sowohl die Schnittfläche als auch der Grat mit 
einem Median von 2 oder besser bewertet. 


6.2.1.1 Fazit 


Aus der Auswertung der Expertenbefragung lassen sich die folgenden 
Schlüsse ziehen: 
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= Verschiedene Menschen haben unterschiedliche Präferenzen. Das 


gilt vor allem für die Schnittfläche, die verschiedene Merkmale auf- 
weist, welche unterschiedlich gewichtet werden. Beim Grat weichen 
die Bewertungen weniger voneinander ab. Die Qualitätsbewertung 
sollte nicht einer einzelnen Person überlassen werden, da diese 
weder ein repräsentatives noch ein reproduzierbares Urteil fällen 
kann. 


Wichtig für die Schnittflächenbewertung aller Experten sind die 
Rauheit und die Homogenität. Ob eine Schnittkante homogen aus- 
sieht, hängt vermutlich davon ab, wie stark sich die verschiedenen 
horizontalen Schichten unterscheiden und wie deutlich einzelne 
Riefen sichtbar sind. Es besteht also ein Zusammenhang mit der 
in verschiedenen Blechtiefen gemessenen Rautiefe. Die Rechtwink- 
ligkeitstoleranz scheint in dem 3mm dicken Edelstahlblech eine 
sehr untergeordnete Rolle für das menschliche Qualitätsurteil zu 
spielen, deshalb wird sie im weiteren Verlauf der Arbeit nicht mehr 
thematisiert. In anderen Blechdicken kann das anders sein. 


6.2 Qualitätsbeurteilung 


Eine Ergänzung der subjektiven Einschätzung durch objektive Kri- 
terien, insbesondere Rautiefe und Grathöhe, wäre sehr sinnvoll. 
Für eine Nachbildung des (durchschnittlichen) menschlichen Ein- 
drucks reichen diese beiden Größen jedoch nicht aus. Im Rahmen 
der CIRP-Konferenz Intelligent Computation in Manufacturing En- 
gineering 2020 wurde ein Modell präsentiert, mit dem der Median 
der Expertenbewertungen basierend auf objektiven Merkmalen der 
Schnittkante nachgebildet werden kann [TP20c]. Als Eingangsdaten 
dienten neben den bereits eingeführten Messgrößen zahlreiche wei- 
tere Merkmale, die aus den 3D-Punktwolken berechnet wurden. Der 
subjektive Eindruck ließ sich zuverlässig nachbilden. Die Interpreta- 
tion der Zusammenhänge zwischen Merkmalen und menschlichem 
Eindruck erwies sich trotz eines einfachen Modellansatzes aufgrund 
der Merkmalskomplexität als schwierig. Für eine allgemeingiilti- 
ge Qualitätsbewertung reicht die aktuelle Datenbasis noch nicht 
aus, weil lediglich fünf Personen desselben Unternehmens befragt 
wurden. 


Geschnittene Teile werden in der Praxis oft nachbearbeitet, um die 
Qualität zu verbessern (siehe Abschnitt 2.2.2). Je nachdem welche 
Nachbearbeitungsmethoden vorhanden sind, könnten die Präferen- 
zen hinsichtlich der Schnittkante noch unterschiedlicher sein. Muss 
jedes Teil z. B. manuell entgratet werden, sollte die Minimierung des 
Grats angestrebt werden. Ist dagegen eine Entgratmaschine vorhan- 
den, könnte die maximale Produktivität das wichtigste Kriterium 
sein. 


Wegen der individuellen Präferenzen, der unterschiedlichen Mög- 
lichkeiten zur Nachbearbeitung und der Vielzahl von Einsatzbe- 
reichen für mit dem Laser geschnittene Teile ist der Mehrwert ei- 
nes Modells, das die Qualitätsbewertung eines „Durchschnittsmen- 
schen“ nachbilden kann, vermutlich eher gering. Nützlicher wäre 
die Möglichkeit, den Schneidprozess automatisiert an individuelle 
Kundenanforderungen anpassen zu können. 


Bei einem gegenüber dem LTT-Wert erhöhten Vorschub sind beson- 
ders viele gut bewertete Schnittkanten zu finden. Dieser Bereich 
wird bislang aus Sicherheitsgründen nicht genutzt. Wenn man den 
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Tabelle 6.5 Einschätzung der Experten, welcher Prozessparameter kleiner, gleich oder 
größer als der LTT-Wert eingestellt war. Die Anzahl der richtig klassifizierten Parameter (für 
insgesamt 10 Teile) ist hier angegeben. 


Experte ADB EM Gasdruck Vorschub 
El 5 6 5 3 

E2 = = = = 

E3 3 2 3 1 

E4 2 4 0 4 

E5 - - = = 

Ø 33% 40% 26 % 26 % 


Schneidprozess besser kontrollieren könnte und kleinere Sicherheits- 
faktoren vorhalten müsste, würde man eine deutliche Produktivi- 
tätssteigerung bei gleichzeitiger Verbesserung der Qualität erreichen. 
Die in Abschnitt 6.3 beschriebene Methode zur Überwachung des 
Maschinenzustands trägt zu einer besseren Kontrollierbarkeit bei. 


6.2.1.2 Schätzung der Prozessparameter durch die Experten 


In einer Woche der Expertenbefragung waren die Experten aufgefordert, 
für zehn Teile einzuschätzen, wie die zugrunde liegenden Prozessparame- 
ter eingestellt waren. Dabei gab es für jeden Parameter drei Auswahlmög- 
lichkeiten: kleiner als der LTT-Wert, gleich dem LTT-Wert und größer als 
der LTT-Wert. Die Ergebnisse sind in Tabelle 6.5 zusammengefasst. 

Zwei der fünf Experten gaben an, keine Aussage treffen zu können. Die 
anderen drei klassifizierten die zehn Teile. Beim ADB lagen sie durch- 
schnittlich bei 33% der Fälle richtig, beim EM bei 40 % der Teile und beim 
Gasdruck und Vorschub ordneten sie 26% der richtigen Klasse zu. Ei- 
ne rein zufällige Wahl der Klasse führt bei drei Auswahlmöglichkeiten 
zu einer Trefferquote von 33 %, was ungefähr der Leistung der Experten 
entspricht. 


Diskussion Auch wenn die Anzahl der befragten Personen und die An- 
zahl zu klassifizierender Teile zu klein war, um zu fundierten Aussagen 
zu kommen, kann man davon ausgehen, dass Menschen nicht in der Lage 
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sind, von der Schnittkante zurück auf die Prozessparameter zu schließen. 
Einige der Experten glaubten, dass das prinzipiell nicht möglich sei, weil 
es keinen eindeutigen Zusammenhang zwischen Kante und Prozesspa- 
rametern gebe und ganz unterschiedliche Parameterkombinationen zum 
selben Schnittbild führen würden. Wie in Abschnitt 6.3.1 gezeigt wird, ist 
diese Annahme falsch. Die Komplexität der Zusammenhänge war ledig- 
lich zu groß für die befragten Experten und ist es vermutlich auch für alle 
anderen Menschen. 


6.2.2 Bildbasierte Schätzung der Rautiefe 


Wie an anderen Stellen bereits erläutert (siehe z. B. Abschnitt 1.1.1 und 
6.2.1.1), erscheint eine bildbasierte Schätzung der Rautiefe als sinnvoll, 
damit diese Größe ohne Oberflächenmessgerät zur Verfügung gestellt wer- 
den kann. Deshalb wird hier ein Ansatz zur Bestimmung des Rz-Wertes an 
verschiedenen Stellen der Schnittkante mit einem CNN vorgestellt. Ähnli- 
che Ergebnisse wurden bereits im Rahmen der CIRP-Konferenz Photonic 
Technologies 2020 vorgestellt [TP20a]. 


6.2.2.1 Einfluss des Datentyps 


Es wurde bereits darauf hingewiesen, dass eine schlechte Datenqualität ne- 
gative Auswirkungen auf datenbasierte Modelle haben kann. Auf diesen 
Aspekt wird folglich ein besonderes Augenmerk gelegt. Für die bildba- 
sierte Bestimmung der Rautiefe wurde das in Abschnitt 5.1.3 beschriebene 
CNN verwendet. Als Eingangsdaten wurden die vorverarbeiteten qua- 
dratischen RGB-Bilder der Schnittkante genutzt (siehe Abschnitt 4.2.2.1). 
Als Labels wurden für jedes Bild neun Rz-Werte (der Messlinien 03 bis 
27) verwendet. Für Training und Validierung wurden einmal die mit dem 
Autoencoder korrigierten (CNN AE) und einmal die originalen, unberei- 
nigten Messdaten (CNN MI) eingesetzt. Getestet wurde in beiden Fällen 
mit den Rz-Werten, die sich aus der Kombination der Messdurchgänge 
I und Il ergeben, weil dies die qualitativ besten verfügbaren Daten sind 
(siehe Abbildung 6.5). Diese wurden nicht für das Training eingesetzt, weil 
hier die Beurteilung der praktischen Anwendbarkeit im Vordergrund steht. 
Dafür sollte jede Schnittkante aus Zeitgründen nur einmal vermessen wer- 
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den müssen. Außerdem kann man so gut den Einfluss der Datenqualität 
auf die Modellgüte verdeutlichen. 

In Abbildung 6.16 sind die mittleren absoluten Testfehler pro Messlinie 
gezeigt. Zusätzlich zu den MAEs der beiden CNNs sind die sogenannten 
theoretischen Fehler aufgetragen: Ein Modell hätte diese Fehler, wenn es 
während des Trainings lediglich den Mittelwert jeder Messlinie lernen und 
diesen beim Testen vorhersagen würde. Da das CNN AE und das CNN MI 
auf unterschiedlichen Datensätzen (gleiche Bilder, andere Labels) trainiert 
wurden, unterscheiden sich auch ihre theoretischen Fehler. Bei CNN AE 
liegt der MAE stets unterhalb des theoretischen Fehlers. Dieses Netz ist 
also in der Lage, die Rautiefenwerte ausgehend von einem RGB-Bild zu 
schätzen. Der über alle Messlinien gemittelte Fehler beträgt 2,7 um, den 
größten Fehler weist die Messlinie 06 mit 3,4 um auf, den kleinsten die 
Messlinie 27 mit 2,3 um. Der Fehler im oberen Bereich der Schnittkante 
ist etwas größer als im mittleren und unteren Bereich. Bei CNN MI ist 
der theoretische Fehler größer, da der Mittelwert der unbereinigten Daten 
stärker von den zum Testen verwendeten Labels abweicht. Der Fehler 
von CNN MI liegt zwar ebenfalls unterhalb des theoretischen Fehlers, 
ist jedoch deutlich größer als der von CNN AE. Die Unterschiede der 
MAES der beiden Netze sind für die Messlinien 03 und 06 besonders 
groß, der Fehler des auf den Originaldaten trainierten Modells ist aber für 
alle Messlinien höher. Der gemittelte Fehler beträgt 4,8 um. Eine bessere 
Trainingsdatenbasis führt also zu einer besseren Modellgüte. 

Warum der Fehler von Messlinie 03 bei beiden Modellen besonders groß 
ist, wird in Abbildung 6.17 deutlich. Dort werden die Vorhersagen der 
beiden CNNs jeweils mit den Labels der Testdaten verglichen. Idealer- 
weise sollten alle Datenpunkte auf der schwarzen Linie liegen. Das ist 
vor allem bei Messlinie 03 nicht der Fall. Dort kommt es bei CNN AE zu 
größeren Abweichungen zwischen Vorhersage und Label aufgrund von zu 
kleinen vorhergesagten Rauheitswerten. Bei CNN MI kommt es ebenfalls 
zu größeren Abweichungen, allerdings sind die vorhergesagten Werte in 
den meisten Fällen deutlich größer als das Label. Für die Messlinien 15 
und 27 erreichen beide Modelle eine ähnliche Güte. Es treten nur wenige 
große Abweichungen auf, bei CNN MI etwas mehr als bei CNN AE. 
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Abbildung 6.16 Mittlerer absoluter Fehler pro Messlinie auf dem Testdatensatz von Split 
1. Es sind die Fehler des CNNs AE und des CNNs MI aufgetragen, die mit verschiedenen 
Labels trainiert, aber mit denselben Daten getestet wurden. Zusätzlich ist der theoretische 
Fehler eingetragen. Die gestrichelten Linien zeigen den Mittelwert über die neun Messlinien 
der jeweiligen Kurve an. 


Diskussion Die Vorhersagen von CNN AE sind nur auf den ersten Blick 
teilweise falsch und viel zu niedrig: Beispielsweise werden für Messlinie 
03 bei Labels über 40 um Rautiefenwerte unter 20 um vorhergesagt. Alle 
in Abbildung 6.17(a) gezeigten Datenpunkte, die in der Kombination der 
Messdurchgänge I und II einen Wert von über 40 um aufweisen, wurden 
manuell überprüft. Sie sind (fett gedruckt), zusammen mit den Rautiefen- 
werten der anderen drei Kanten desselben Teils, in Tabelle 6.6 aufgelistet. 
Wie man sieht, weisen mindestens zwei der Kanten desselben Teils deut- 
lich kleinere Rautiefenwerte auf. Deshalb ist es gut möglich, dass die 
Labels in diesem Fall fälschlicherweise etwas zu groß sind und dass das 
CNN AE den Rautiefenwert richtig einschätzt. Die großen Abweichungen 
würden in diesen Fällen also nicht durch falsch gelernte Modellparameter, 
sondern durch die (immer noch) verbesserungswürdige Datenqualität 
verursacht. 

Wie bereits in den Abschnitten 4.2.1.3 und 6.1.2 beschrieben, kommt es 
bei der Rz-Messung aufgrund der hohen Reflektivität der Edelstahlober- 
flächen häufig zu Problemen und zu falschen, viel zu großen Messwerten. 
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Tabelle 6.6 Rautiefenwerte ausgewählter Kanten in der Kombination der Messdaten von 
Messung I und II. Die zugehörigen Bilder der Schnittkanten sind in Anhang A.3 zu finden. 


Teil Kantel Kante2 Kante3 Kante4 
in um in um in um in pm 


0949 9 11 54 38 
0992 12 10 51 16 
1006 12 9 40 33 
1056 8 8 13 47 
1077 8 7 45 40 


Bei der Kombination der beiden Messdurchgänge werden viele, aber nicht 
alle Messfehler (ausreichend) korrigiert. Das CNN AE konnte, obwohl 
seine Trainingsdatenbasis nicht fehlerfrei war, den grundlegenden Zusam- 
menhang zwischen dem Bild einer Schnittkante und dem Rautiefenwert 
an verschiedenen Stellen erlernen. Die Modellgüte wird möglicherweise 
aufgrund von falschen Testlabels sogar unterschätzt. Bei CNN MI ist das 
anders. Hier treten tatsächlich falsche, zu große Vorhersagen aufgrund 
nicht korrekt erlernter Zusammenhänge zwischen Bild und Rautiefe auf. 
Der Grund dafür ist die schlechtere Trainingsdatenbasis. Die unbereinig- 
ten Messdaten des ersten Messdurchgangs enthalten mehr und stärkere 
Ausreißer als die mit dem Autoencoder korrigierten Messwerte. CNN 
AE konnte die systematischen Zusammenhänge erlernen, bei CNN MI 
war das kaum noch möglich. Die Vorhersagen beider CNNs sind beson- 
ders mangelhaft für die Messlinien 03 und 06, deren Datenqualität am 
schlechtesten ist. 


6.2.2.2 Einfluss der Datenaufteilung und Überanpassung 


In Abbildung 6.18(a) sind die Fehler von drei CNNs gegeniibergestellt. Sie 
wurden auf unterschiedlichen Teilmengen (Split 1,2 oder 3) der mit dem 
Autoencoder bereinigten Daten trainiert und validiert und auf ebenfalls 
verschiedenen Teilmengen der kombinierten Messdaten von Durchgang I 
und II getestet. So lässt sich der Einfluss der Datenaufteilung untersuchen. 

Die Modellfehler auf Testset 1 und 3 sind sehr ähnlich. Die größte Ab- 
weichung zwischen ihnen beträgt 0,7 um bei Messlinie 09. Die MAEs auf 
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(c) Vorhersage von CNN AE und Label für Messli- (d) Vorhersage von CNN MI und Label für Messli- 
nie 15. nie 15. 
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(e) Vorhersage von CNN AE und Label für Messli- (f) Vorhersage von CNN MI und Label für Messli- 
nie 27. nie 27. 


Abbildung 6.17 Vergleich von Vorhersage und Label auf dem Testdatensatz (Split 1) für die 
Rz-Messlinien 03, 15 und 27. 
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(a) Mittlerer absoluter Fehler pro Messlinie für drei (b) Trainings- und Validierungsfehler des CNNs 
CNNs AE, die auf verschiedenen Aufteilungen der AE auf Split 1. 

Daten trainiert und getestet wurden. Gestrichelt 

eingetragen sind die theoretischen Fehler. 


Abbildung 6.18 Mittlerer absoluter Fehler für drei verschiedene Aufteilungen der Daten 
und Verlauf der Trainings- und Validierungsfehler über der Epochenanzahl. 


dem Testset 2 sind systematisch größer, zwischen 0,5 um auf Linie 03 bis zu 
1,7 um auf Messlinie 09. Die Trainings- und Validierungsfehler auf den drei 
Datensätzen entwickeln sich sehr ähnlich, nur die Testfehler unterscheiden 
sich. 


Diskussion Warum der Testfehler bei Split 2 höher ausfällt, ist schwer zu 
sagen. Eine mögliche Erklärung ist, dass die Trainings- und Validierungs- 
daten aufgrund der kleinen Datenbasis bei manchen Aufteilungen nicht 
ausreichend repräsentativ sind, um die Zusammenhänge auf unbekannten 
Daten korrekt vorherzusagen. 


In Abbildung 6.18(b) ist der Verlauf der Trainings- und Validierungsfehler 
— gemittelt über die neun Messlinien - für Split 1 gezeigt. Der Validierungs- 
fehler schwankt zunächst, stabilisiert sich dann aber. Mit zunehmender 
Epochenanzahl kommt es zu einer Überanpassung an die Trainingsdaten. 
Der Validierungsfehler beträgt 3,3 um, der Trainingsfehler 2,5 um. 


6.2.2.3 Fazit 


Auch wenn es auf den ersten Blick nicht so aussehen mag, weil es möglich 
war, die grundsätzlichen Zusammenhänge zwischen RGB-Bild und Rau- 
tiefe zu modellieren, sind die Messfehler in vielerlei Hinsicht ein Problem. 
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Sie vergrößern den MAE sowohl während des Trainings als auch im Test. 
Aufgrund ihrer Größe können sie dazu führen, dass das Modell während 
des Trainings versucht, die Ausreißer „auswendig“ zu lernen, anstatt die 
generellen Zusammenhänge zu verstehen, weil sich die Verlustfunktion 
dadurch deutlich verringern lässt. Dadurch wird das Netz an die Trai- 
ningsdaten überangepasst. Je nachdem wie viele Messfehler in den Daten 
auftreten, können die grundlegenden Zusammenhänge gut (CNN AE) 
oder eher schlecht (CNN MI) erlernt werden. 

Auch wenn hauptsächlich die oberen Messlinien fehlerbehaftet sind, be- 
trifft das Problem die Vorhersage auf allen Messlinien, weil die Fehler 
der neun Regressionsziele während des Trainings gemittelt werden. Das 
könnte der Grund dafür sein, dass die Fehler des CNNs MI grundsätzlich 
größer sind als die von CNN AE. Der wichtigste Schritt zur Verbesse- 
rung des Modells ist deshalb die weitere Verbesserung der Datenqualität. 
Der zuverlässigste Weg wäre es, Schnittkanten mehrfach aufzunehmen. 
Um dies effizienter zu gestalten, könnten beispielsweise zunächst nur die 
Kanten erneut vermessen werden, bei denen die Abweichung zwischen 
Label und Modellvorhersage besonders groß ist. Noch besser wäre es, die 
Rz-Labels mit einem tastenden Messverfahren zu generieren. Zusätzlich 
könnte durch eine stärkere Regularisierung der Modellparameter eine 
geringere Anpassung an einzelne, fehlerhafte Trainingsbeispiele erreicht 
werden. 


6.3 Überprüfung des Maschinenzustands 


Im Folgenden wird zunächst das Konzept zur Überprüfung des Ma- 
schinenzustands vorgestellt. Dieses basiert auf der Schätzung der Ist- 
Prozessparameter mit einem faltenden neuronalen Netz. Die Güte des 
Modells wird im Anschluss detailliert evaluiert. 

In Abschnitt 2.4.2 wurde erläutert, wie der Zustand einer Laserschneid- 
maschine in der Praxis überprüft wird. Ein klar definierter und stabiler 
Maschinenzustand ist die Grundvoraussetzung für die Beherrschbarkeit 
des Prozesses, weil Laserschneiden ein gesteuerter Prozess ist, bei dem 
Soll- und Ist-Parameter (ausreichend gut) übereinstimmen müssen. Es 
gibt zwar erste Ansätze zur Regelung des Schneidprozesses, beispiels- 
weise von Hesse et al. [HSR14] und Thombansen et al. [Tho+14], aber 
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diese erfordern zusätzliche Hard- und Software und sind bislang in fast 
keiner Maschine vorhanden. Deshalb wurde ein Konzept entwickelt, mit 
dem der Zustand einer Laserschneidmaschine automatisiert überprüft 
bzw. dauerhaft überwacht werden kann. Anstatt Sensorsignale von Ein- 
zelkomponenten auszuwerten, wird dafür die Schnittkante verwendet, 
weil dort alle Einflussgrößen zusammenkommen. Ausgehend von einem 
Bild der Schnittkante werden die Ist-Prozessparameter mit einem CNN 
bestimmt und mit den eingestellten Soll-Werten verglichen. Anders als die 
genannten Regelungsansätze erfordert dieses Konzept keine aufwendige 
Sensorik, sondern lediglich ein RGB-Bild der Schnittkante. Eine Regelung 
kann damit jedoch nicht umgesetzt werden, da die Kante während des 
Schneidens nicht aufgenommen werden kann. 

Solange sich die Maschine im Soll-Zustand befindet, stimmen beide 
Größen überein. Differenzen deuten auf Probleme in der Maschine hin. 
Wurde beispielsweise eine Fokusposition von -1,0mm eingestellt, das 
neuronale Netz erkennt jedoch, dass sich der Strahlfokus an der Blecho- 
berkante (bei 0,0 mm) befindet, so verschiebt eine Maschinenkomponente 
den Strahlfokus nach oben, z. B. weil sie verschmutzt ist und sich erhitzt. 
Auch wenn es nicht möglich ist, von einer Parameterabweichung direkt 
auf die defekte oder verschmutzte Komponente zu schließen, schränkt 
die Kenntnis des veränderten Parameters den Suchraum erheblich ein 
und verkürzt die Stillstandszeit. In voll automatisierten Maschinen, in 
denen regelmäßig ein Bild der Schnittkante aufgenommen werden kann, 
könnte Ausschuss vermieden werden, indem die Maschine angehalten 
wird, sobald sich das Prozessergebnis verändert. 

Dieser Ansatz funktioniert nur, wenn es möglich ist, die Ist-Parameter 
aus der Schnittkante abzuleiten. Dass der Mensch dazu nicht in der Lage 
ist, wurde in Abschnitt 6.2.1.2 dargestellt. Mit dem entwickelten CNN kann 
diese Aufgabe aber bewältigt werden. Eine Kurzfassung der präsentierten 
Ergebnisse wurde bereits publiziert [Tat+21]. 


6.3.1 Bildbasierte Regression der Prozessparameter 


Für die Regression der fünf Prozessparameter ADB, EM, Fokusposition, 
Gasdruck und Vorschub wurde das in 5.1.1 beschriebene CNN entwickelt 
und trainiert. In Tabelle 6.7 ist der mittlere absolute Fehler des Modells 
für drei verschiedene Eingangsdatentypen gezeigt. Die RGB-, Höhen- 
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und RGBD-Bilder wurden jeweils dreimal (Split 1,2 und 3) in Trainings-, 
Validierungs- und Testdatensatz aufgeteilt. Um die Größe der Fehler besser 
einschätzen zu können, ist der sogenannte theoretische Fehler ebenfalls 
angegeben. Dabei handelt es sich um den Fehler eines Modells, das im 
Training lediglich den Mittelwert des jeweiligen Parameters lernt und 
diesen beim Testen vorhersagt. 


6.3.1.1 Einfluss des Datentyps 


Die Ergebnisse zeigen, dass es möglich ist, die Prozessparameter direkt 
von der Schnittkante abzuleiten. Das CNN, welches auf den RGB-Bildern 
trainiert wurde, macht bei der Schätzung des Vorschubs einen Fehler 
von durchschnittlich 1,1 m/min. Das entspricht 23% des theoretischen 
Fehlers. Für die Fokusposition beträgt der Fehler 0,2 mm. Das sind 22 % 
des theoretischen Fehlers. Die durchschnittlichen MAEs für ADB, EM und 
Gasdruck sind größer. Sie entsprechen 57, 44 und 51 % des theoretischen 
Fehlers. Die Fehler von ADB, EM und Fokusposition unterscheiden sich 
zwischen den drei Splits um maximal 0,1 mm, beim Gasdruck um 0,1 bar. 
Lediglich beim Vorschub kommt es zu einer etwas größeren Abweichung 
zwischen Split 1 bzw. 3 und 2. 

Die über die Splits gemittelten Fehler für den ADB, das EM und die 
Fokusposition unterscheiden sich kaum zwischen den drei Eingangsda- 
tentypen. Der Vorschub wird bei Vorhandensein der Höheninformation 
etwas besser geschätzt. Der durchschnittliche MAE ohne die Höhenin- 
formation beträgt 1,1 m/min und mit der Höheninformation 0,9m/min. 
Lediglich beim Gasdruck liegt ein deutlicher Unterschied zwischen RGB- 
bzw. RGBD- und Höhen-Graustufenbild als Eingangsdaten vor. Wenn 
keine Farbinformation vorhanden ist, ist der Gasdruck schlechter ein- 
schätzbar. Mit der Farbinformation ist der durchschnittliche MAE 1,9 bar, 
ohne diese ist der Fehler um 0,4 bar größer. 


Diskussion Vermutlich sind Vorschub und Fokusposition die dominan- 
ten Einflussgrößen und werden von den anderen Einflüssen am wenigsten 
überlagert. Deshalb sind sie für das CNN besonders gut zu erkennen. 
Schwieriger ist die Erkennung der beiden Parameter, die die Gasdynamik 
beeinflussen: ADB und Gasdruck. Da ADB, EM und Fokusposition zu- 
sammenhängen, pflanzt sich der Fehler bei der Bestimmung des ADBs 
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vermutlich auf das EM fort. Anders ist nicht zu erklären, dass die Fokus- 
position deutlich besser geschätzt werden kann als das Einstellmaß. Die 
Schwankungen der Fehler für verschiedene Aufteilungen der Daten sind 
relativ klein. Sie werden vermutlich durch die kleine Datenbasis verur- 
sacht. Wahrscheinlich beeinflusst der Gasdruck die Farbe der Schnittkante 
stärker als die anderen Parameter und kann deshalb bei Fehlen der Farbin- 
formation etwas schlechter geschätzt werden. Diese Vermutung wird in 
Abschnitt 6.4.1 nochmals aufgegriffen. Dass die Höheninformation nicht 
zwingend benötigt wird, um die Prozessparameter zu schätzen, ist für 
die praktische Anwendung vorteilhaft: Anstatt eines teuren Messgeräts 
könnte eine normale Kamera genutzt werden. In den nächsten Abschnitten 
werden nur die Ergebnisse für das Training des CNNs auf RGB-Bildern 
diskutiert. 


6.3.1.2 Detaillierte Evaluierung der Fehler 


Die Verteilung der Fehler auf unbekannten Daten ist in Abbildung 6.19(a) 
für die Fokusposition gezeigt. Auf der Abszisse ist die Differenz zwischen 
Vorhersage und Label aufgetragen. Die zu den Abbildungen gehörenden 
Mittelwerte und Standardabweichungen sind in Tabelle 6.8 angegeben. 
Zusätzlich ist vermerkt, wie viele Teile dieser Faktorstufe im Trainingsda- 
tensatz vorlagen. Bei der Fokusposition ist die Verteilung des Fehlers für 
den LTT-Wert (-0,5 mm) symmetrischer um 0 als bei den anderen Fokus- 
positionen und Standardabweichung sowie MAE sind kleiner. Niedrige 
Fokuspositionen (-1,5 mm) werden tendenziell etwas zu hoch vorherge- 
sagt. Zu hohe Fokuspositionen (0,5mm) werden im Schnitt zu niedrig 
eingeschatzt. Analog dazu ist die Verteilung des Fehlers fiir den Vorschub 
in Abbildung 6.19(b) zu sehen und in Tabelle 6.8 beschrieben. Wahrend 
der Mittelwert der Fehlerverteilung fiir 13 und 21m/min nahe 0 liegt, 
kommt es bei 29m/min zu einer deutlichen Abweichung der Vorhersage 
hin zu niedrigeren Geschwindigkeiten. 


Diskussion Hier macht sich die Unausgeglichenheit des Datensatzes 
bemerkbar. Aufgrund der Fehlschnitte sind die Faktorstufen im Datensatz 
ungleich verteilt (siehe Abschnitt 6.4.2), was durch die zufällige Auftei- 
lung in Trainings-, Validierungs- und Testdatensatz noch verstärkt werden 
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Tabelle 6.7 Mittlerer absoluter Testfehler pro Prozessparameter und Split für drei verschie- 
dene Eingangsdatentypen, ergänzt durch den theoretischen Fehler (der nur von den Labels 
abhängt). 


Daten Split ADB EM FP Druck Vorschub 
inmm inmm inmm inbar inm/min 
1 0,4 0,3 0,2 19 0,9 
2 0,4 0,4 0,2 1,9 1,3 
ROB 3 0,3 0,4 0,2 2,0 1,0 
Ø 0,4 0,4 0,2 1,9 1,1 
1 0,4 0,4 0,2 2,3 0,9 
. 2 0,4 0,5 0,2 2,4 0,8 
Hohe 4 0,4 0,4 0,2 23 1,0 
Ø 0,4 0,4 0,2 2,3 0,9 
1 0,3 0,3 0,2 1,7 1,0 
2 0,4 0,4 0,2 2,1 0,8 
ROBE 3 0,3 0,4 0,2 1,8 0,8 
Ø 0,3 0,4 0,2 1,9 0,9 
1 0,7 0,9 0,9 3,7 5,1 
Theor 2 0,7 0,8 0,8 3,7 4,8 
"3 0,7 0,9 0,9 3,6 4,3 
Ø 0,7 0,9 0,9 3,7 4,7 
g 3,0 g 0,75 
E E 
Y 20 Y 0,50 
6D - 6D 
= / = 
= 10 Q = 0,25 
£ £ / 
H H 4 
S 00 RN SZ 0,00l Lal j- 
—1,0 -05 00 0,5 1,0 -4 -3 -2 -21 0 1 2 3 4 
Fehler in mm Fehler in m/min 


(a) Verteilung der Fehler für drei Faktorstufen der (b) Verteilung der Fehler für drei Faktorstufen des 
Fokusposition. Vorschubs. 


Abbildung 6.19 Verteilung der Fehler (Vorhersage — Label) für verschiedene Labels auf 
dem Testset 1. 
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kann. Bei der Fokusposition gilt, dass das Fehlschnittrisiko mit zunehmen- 
der Entfernung vom LTT-Wert steigt. Für diesen Wert liegen besonders 
viele Trainingsbeispiele vor, die Zusammenhänge konnten besser trainiert 
werden. Der Fehler ist am kleinsten. Es liegt eine kleine Verschiebung hin 
zu großen Werten vor (Mittelwert 0,1). Dies könnte ebenfalls durch die Da- 
tenverteilung im Training verursacht worden sein, da höhere Faktorstufen 
mit 379 Teilen häufiger vertreten waren als niedrigere Faktorstufen mit 
222 Teilen. 

Beim Vorschub macht sich die Ungleichverteilung der Trainingsdaten 
ebenfalls bemerkbar. Allerdings gilt hier, dass das Fehlschnittrisiko für 
niedrige Geschwindigkeiten besonders klein und für hohe Geschwindig- 
keiten besonders groß ist. Deshalb sind insbesondere für die Faktorstufe 
29 m/min nur wenige Daten vorhanden, was zu einer Verschiebung der 
Vorhersage hin zu langsamen Werten und zu einem insgesamt größeren 
Fehler führt. Das Übergewicht der Geschwindigkeiten 13 und 17 m/min 
führt nicht dazu, dass der LTT-Wert prinzipiell als zu klein eingeschätzt 
wird. 

In Tabelle 6.9 sind die maximalen Fehler des CNNs auf unbekannten Daten 
aufgelistet. Beispielsweise beträgt der maximale Fehler für den Vorschub 
zwischen 5,6 und 7,5m/min, was 35 bzw. 47% der Bandbreite und 140 
bzw. 188% der Schrittweite der Parametervariation entspricht. Für die 
praktische Anwendung müssten die maximalen Fehler deutlich reduziert 
werden. 


6.3.1.3 Vergleich der Trainings-, Validierungs- und Testfehler 


In Abbildung 6.20 sind der Trainings- und Validierungsfehler des CNNs 
für den Split 1 exemplarisch für Vorschub und Gasdruck zu sehen. Das 
Training wurde nach 64 Epochen beendet, weil sich der Validierungsfehler 
über 20 Epochen nicht verbessert hatte. Die Modellparameter des CNNs 
entsprechen denen in Epoche 44. Während der Trainingsfehler in beiden 
Fällen kontinuierlich abnahm, schwankte der Validierungsfehler von Epo- 
che zu Epoche deutlich. Mit zunehmender Anzahl an Epochen stabilisierte 
er sich jedoch. 

Für den Vorschub (siehe Abbildung 6.20(a)) und die Fokusposition ist 
die Differenz zwischen Trainings- und Validierungsfehler sehr gering. Zu 
größeren Unterschieden kommt es jedoch bei Gasdruck (siehe Abbildung 
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Tabelle 6.8 Anzahl der Teile, Mittelwert und (empirische) Standardabweichung der in 
6.19 gezeigten Kurven und MAE für verschiedene Faktorstufen der Fokusposition und des 


Vorschubs. 
Fokusposition -1,5mm -0,5mm 0,5 mm 
Anzahl Teile 52 99 90 
Mittelwert 0,3 0,1 —0,1 
Standardabweichung 0,3 0,2 0,3 
MAE 0,3 0,2 0,3 
Vorschub 13m/min 21m/min 29m/min 
Anzahl 141 145 63 
Mittelwert 0,2 0,1 —0,7 
Standardabweichung 0,9 13 11 
MAE 0,7 1,0 11 


Tabelle 6.9 Vergleich der maximalen Fehler für drei verschiedene Aufteilungen in Trainings- 
, Validierungs- und Testdaten mit den Bandbreiten und Schrittweiten der Parametervariation. 


Daten Split ADB EM FP Druck Vorschub 
inmm inmm inmm inbar inm/min 
Bandbreite - 2,5 3 55 12 16 
Schritt — 0,5 0,5 0,5 3,0 4,0 
1 2,0 1,9 3,2 10,7 5,9 
2 2,0 1,7 2,0 10,2 75 
RCE 3 1,6 1,7 19 11,2 5,6 
Ø 1,9 1,8 2,4 10,7 6,3 
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(a) Mittlerer absoluter Fehler fiir den Vorschub. (b) Mittlerer absoluter Fehler fiir den Gasdruck. 


Abbildung 6.20 MAE des Vorschubs und des Gasdrucks über der Anzahl an Epochen fiir 
Training und Validierung mit Split 1. 


6.20(b)), ADB und EM. In allen drei Fällen sind die Validierungs- und 
Testfehler um 50 % und mehr größer als die Fehler während des Trainings. 


Diskussion Bei ADB, EM und Gasdruck machen sich bereits Über- 
anpassungs-Effekte bemerkbar. Das CNN beginnt, die Parameter zu den 
Bildern im Trainingsdatensatz „auswendig“ zu lernen, um die Verlust- 
funktion (den MSE) zu reduzieren. Dieser Effekt ist bei den genannten 
drei Parametern vermutlich stärker, weil die Zusammenhänge zwischen 
ihnen und dem Bild der Schnittkante schwieriger zu erkennen sind. Der 
Trainingsfehler sinkt immer weiter ab, während der Validierungsfehler 
stagniert. Signifikante Verbesserungen könnten wahrscheinlich durch die 
Verwendung von mehr Daten erzielt werden. 


6.4 Erweiterung des Prozessverständnisses 


Wie bereits erläutert wurde (siehe z.B. Abschnitt 1.1.3), verlangen die 
veränderten Anforderungen an die fertigende Industrie eine vollständige 
Beherrschung des gesamten Produktionsprozesses. Im vorangegangenen 
Abschnitt wurde bereits ein datenbasiertes Modell, mit dem der Zustand 
der Laserschneidmaschine überprüft werden kann, vorgestellt. Dies könn- 
te auch dazu beitragen, den Gesamtprozess beherrschbarer zu machen. Im 
Folgenden wird noch auf zwei weitere Aspekte eingegangen. Zunächst 
werden die von CNNs erlernten Zusammenhänge zwischen dem Foto der 


148 


6.4 Erweiterung des Prozessverständnisses 


Schnittkante und den zugrunde liegenden Prozessparametern visualisiert. 
Dazu wird die Layer-wise Relevance Propagation Methode eingesetzt, die 
für die Entscheidung des CNNs besonders relevante Pixel im Eingangsbild 
kennzeichnet. Anschließend wird der Zusammenhang zwischen den Pro- 
zessparametern und dem Fehlschnittrisiko, der Rautiefe und der Grathöhe 
analysiert und modelliert. Für die Modellierung wurden in diesem Fall 
einfache Regressionsansätze gewählt. 


6.4.1 Zusammenhänge zwischen Schnittkante und 
Prozessparametern 


Für die Visualisierung der CNNs wurden zusätzlich zur LRP auch andere 
Visualisierungsmethoden erprobt, z. B. die Visualisierung einzelner Filter, 
Regression Activation Maps [Zho+16] und Class Activation Maximization 
[SVZ14]. Erschwert wird die Visualisierung jedoch durch die große Anzahl 
und Tiefe der Faltungskerne und Feature Maps, durch die starke Redukti- 
on der räumlichen Auflösung in tiefen Schichten und dadurch, dass Bilder 
von Schnittkanten für Menschen schlecht zugänglich sind. Außer der LRP 
lieferte keine der Methoden verständliche Ergebnisse. 


6.4.1.1 Klassifikation nach Prozessparametern 


Für die Visualisierung mit der LRP wurde für jeden Prozessparameter 
separat ein CNN trainiert (siehe Abschnitt 5.1.2), mit dem ein RGB-Bild 
der Schnittkante einer Faktorstufe zugeordnet werden kann. Für den Vor- 
schub unterscheidet das Modell beispielsweise zwischen fünf Klassen: 
13, 17, 21, 25 und 29 m/min. In Tabelle 6.10 ist die Anzahl der Klassen 
jedes Prozessparameters aufgelistet. Außerdem wird dort die gewichtete 
Korrektklassifikationsrate der CNN-Klassifikatoren mit der theoretischen 
Korrektklassifikationsrate verglichen. Diese würde auftreten, wenn die 
CNNs im Training lediglich die am häufigsten auftretende Klasse ler- 
nen und anschließend beim Testen vorhersagen würden. Wie man in der 
Tabelle 6.10 sieht, ist die Trefferquote aller Modelle größer als die theoreti- 
sche. Während die Faktorstufen des Vorschubs und der Fokusposition mit 
durchschnittlich 95 % bei fünf Klassen und 74 % bei zwölf Klassen sehr gut 
zugeordnet werden können, sind die Modelle für ADB, EM und Gasdruck 
deutlich schlechter. 
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Tabelle 6.10 Anzahl Faktorstufen, gewichtete Korrektklassifikationsrate (BCA) der fünf 
CNNs in % verglichen mit der theoretischen Trefferquote. 


Daten Split ADB EM FP Druck Vorschub 
Klassenanzahl - 6 Z 12 5 5 

1 37 36 76 34 96 
ann? ZO ZAE og 

Ø 36 3 7 4 95 
Theor. BCAin% - 17 14 14 20 20 


Diskussion Der Grund daftir ist wahrscheinlich, dass ADB und Gas- 
druck die Gasströmung verändern und dass ADB und EM die Fokusposi- 
tion beeinflussen. Auch wenn die Fokusposition richtig erkannt wird, gibt 
es mehrere Kombinationsmöglichkeiten von ADB und EM. Die Einflüsse 
der Gasdynamik scheinen nicht genügend zusätzliche Information für die 
Bestimmung des ADBs bereitzustellen. 


Die Trefferquote der Experten für eine ähnliche Aufgabe ist in Abschnitt 
6.2.1.2 zu finden. Beim Vergleichen muss man jedoch beachten, dass die 
befragten Personen lediglich drei Kategorien (größer /kleiner/gleich LTT) 
unterscheiden mussten. 


6.4.1.2 Visualisierung der Zusammenhänge 


Nachfolgend werden nur die CNN-Klassifikatoren für Vorschub, Fokus- 
position und Gasdruck betrachtet. Für jedes gezeigte Beispiel und jeden 
Klassifikator wurde die LRP durchgeführt und so eine Heatmap berechnet, 
die die für die Klassenzuordnung wichtigsten Pixel aufzeigt. Anhand von 
zwei Beispielen kann das Potential der Visualisierung für die Erweiterung 
des Prozessverständnisses aufgezeigt werden. Das Zeigen aller Aus- und 
Wechselwirkungen der Prozessparameter in verschiedenen Bereichen des 
Parameterraums würde den Rahmen dieser Arbeit sprengen. 

In Abbildung 6.21 sind die LRP-Heatmaps für zwei verschiedene Schnitt- 
kanten gezeigt. Für ein besseres Verständnis der Darstellung soll hier 
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nochmal kurz darauf eingegangen werden, was die Farben in den Heat- 
maps bedeuten. Rot steht für einen positiven Beitrag eines Pixels zur 
Klassifikationsentscheidung des CNNs. Wird ein Bild beispielsweise der 
Vorschub-Klasse 13 m/min zugeordnet, sind Merkmale der Schnittkante, 
die für diese Klasse sprechen, rot eingefärbt. Blaue Pixel zeigen dagegen 
einen negativen Beitrag an. Diese Pixel senken die Wahrscheinlichkeit der 
Zugehörigkeit zur ausgewählten Klasse (indem sie die Wahrscheinlichkeit 
der Zugehörigkeit zu einer anderen Klasse erhöhen). Die Ausgänge der 
CNNs haben einen Wertebereich von (0, 1], die Summe aller Ausgangs- 
werte ergibt 1. Die RGB-Bilder, deren Heatmaps im Folgenden abgebildet 
sind, werden alle mit einer hohen Wahrscheinlichkeit der korrekten Klasse 
zugeordnet. Für die negativen Beiträge (Relevanzwerte) verbleiben da- 
durch nur relativ kleine Werte. Wenn die Klasse 13 m/min beispielsweise 
mit einer Wahrscheinlichkeit von 0,96 erkannt wird, verbleiben für die an- 
deren vier Faktorstufen nur 0,04. Wichtig zu verstehen ist, dass durch die 
Skalierung (5.16) nicht darauf geschlossen werden kann, dass ein maximal 
blau pigmentiertes Pixel denselben Einfluss (mit entgegengesetztem Vor- 
zeichen) wie ein maximal rot pigmentiertes Pixel hatte. Zur Vereinfachung 
kann man sich auch auf die Betrachtung der roten Pixel beschränken. 

Die in Abbildung 6.21 gezeigten Kanten, 0975-1 und 0606-1, wurden mit 
demselben Vorschub von 13 m/min geschnitten. Da die anderen Prozess- 
parameter verschieden waren, sehen die Kanten unterschiedlich aus. Beim 
Schneiden von Kante 0975-1 befand sich der Strahlfokus 1,0 mm oberhalb 
des Blechs, der Gasdruck betrug 9 bar. Bei Kante 0606-1 war der Strahl- 
durchmesser an der Unterkante des 3mm dicken Blechs am geringsten. 
Der Gasdruck lag bei 12 bar. Die Bilder beider Kanten werden von drei 
Klassifikatoren mit einer hohen Wahrscheinlichkeit von jeweils über 92 % 
korrekt zugeordnet. 

Obwohl der Vorschub bei beiden Kanten gleich war, sehen sie unter- 
schiedlich aus. Es gibt nur eine Gemeinsamkeit. Beide Kanten weisen einen 
eher hohen Grat auf. Kante 0975-1 hat eine Grathöhe von 146 um, bei Kan- 
te 0606-1 ist der Grat sogar 429 pm hoch. Aufgrund dieser Gemeinsamkeit 
würde man vermuten, dass die Faktorstufe 13m/min anhand des Grats 
identifiziert wird. Die LRP-Heatmap 6.21(f) zeigt jedoch, dass diese Eigen- 
schaft für die Klassifikation des Vorschubs irrelevant ist. Hier zeigt sich 
wieder die Komplexität des Schneidprozesses. Ein langsamer Vorschub 
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(a) RGB-Bild der Kante (b) Heatmap Vorschub (c) Heatmap Fokuspo- (d) Heatmap Gasdruck 
0975-1. zu (a). sition zu (a). zu (a). 


(e) RGB-Bild der Kante (f) Heatmap Vor- (g) Heatmap Fokuspo- (h) Heatmap Gasdruck 
0606-1. schub zu (e). sition zu (e). zu (e). 


Abbildung 6.21 RGB-Bilder und LRP-Heatmaps der Kanten 0975-1 und 0606-1. Das Teil 
0975 wurde mit einem Vorschub von 13 m/min, einer Fokusposition von 1,0 mm und einem 
Gasdruck von 9 bar geschnitten. Bei Teil 0606 war der Vorschub gleich, die Fokusposition 
betrug -3,0 mm und der Gasdruck 12 bar. In einer Heatmap blau eingefärbte Pixel sind 
negativ relevant fiir die Klassifikations-Entscheidung des jeweiligen CNNs, rot eingefarbte 
Pixel sind positiv relevant (siehe Abschnitt 5.2.2.1). 


führt in vielen Fällen zu einem hohen Grat. Die mittlere Grathöhe aller mit 
13 m/min geschnittenen Kanten beträgt 207 um, im gesamten Datensatz 
ist sie dagegen nur 104 um. Es gibt jedoch auch mit 13 m/min geschnittene 
Kanten, die nahezu keinen Grat aufweisen. Die Kanten 0338-1, 0637-1 und 
0904-1 haben beispielsweise eine Grathöhe von 26, 37 bzw. 27 um. Als 
Mensch würde man bei diesen Kanten wohl falsch liegen. Die Heatmaps 
könnten dabei helfen, solche Fehlannahmen aufzudecken. 

Für den Vorschub-Klassifikator sind die wichtigsten Bereiche bei Kan- 
te 0975-1 die Oberkante sowie der verfärbte untere Bereich. Bei Kante 
0606-1 sind die Riefenstruktur oben und die Spritzer in der Mitte die 
wichtigsten Merkmale. Wenn man viele Bilder eines Klassifikators und 
einer Faktorstufe vergleicht, ist es vielleicht möglich, charakteristische 
Merkmale abzuleiten. 
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Neben dem Vergleich der Heatmaps desselben CNNs für verschiede- 
ne Kanten ist es auch interessant, die unterschiedlichen Heatmaps einer 
Kante zu betrachten. Die drei Prozessparameter werden jeweils an ande- 
ren Eigenschaften der Schnittkante erkannt. Während der obere Bereich 
der Schnittfläche von Kante 0975-1 Informationen über Vorschub und 
Fokusposition enthält, ist er für die Schätzung des Gasdrucks unwichtig. 
Auch der Riefenverlauf im mittleren Bereich, der für die Fokusposition 
relevant ist, spielt für den Gasdruck keine Rolle. Nur die verfärbten Pixel 
im unteren Bereich und die Gratperlen tragen zum Ausgangswert des 
CNWNs bei. Die Tatsache, dass der verfärbte Bereich der Schnittkante den 
größten positiven Beitrag zur Klassifikation des Gasdrucks leistet, besta- 
tigt, dass es einen starken Zusammenhang mit der Farbe der Schnittkante 
gibt. Das passt zu dem Ergebnis in Abschnitt 6.3.1.1, dass die Regression 
des Gasdrucks ohne die Farbinformation schlechter gelingt. Umgekehrt 
könnte man folgern, dass der Gasdruck hier ausschließlich die Merkmale 
der Unterkante beeinflusst und dass es deshalb beispielsweise unsinnig 
wäre diesen Parameter anzupassen, um den Riefenverlauf der Kante zu 
verändern. 


6.4.1.3 Unterstützung bei Schneidproblemen 


Indem sie Hinweise liefern, welche Parameteranpassung zielführend sein 
könnte, können die LRP-Heatmaps also für die Optimierung der Prozess- 
parameter genutzt und als Unterstützung bei Schneidproblemen einge- 
setzt werden. Dies wird anhand von drei Beispielen gezeigt. 

Die Kante des Teils 0987 in Abbildung 6.22(a) weist Verfärbungen und 
dicke Grattropfen an der Unterkante auf. Wie in der Heatmap in Abbil- 
dung 6.22(b) zu sehen ist, besteht ein deutlicher Zusammenhang zwischen 
der Braunfärbung und dem Vorschub. Die Heatmaps für die Fokusposition 
in Abbildung 6.22(e) und den Gasdruck in Abbildung 6.22(h) zeigen da- 
gegen keinen klaren positiven Zusammenhang mit den verfärbten Pixeln. 
Eine Veränderung des Vorschubs von 13 auf 17 bzw. 21 m/min lässt die 
Verfärbung und die Gratperlen verschwinden, wie in den Abbildungen 
6.22(c) bzw. 6.22(d) zu sehen ist. Eine Veränderung der Fokusposition oder 
des Gasdrucks - egal in welche Richtung - führt dagegen nicht zu einer 
Verbesserung. 
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(a) Nicht zufriedenstel- 
lende Kante. 


(e) Heatmap Fokuspo- 
sition zu (a). 


(h) Heatmap Gasdruck (i) Gasdruck 21 bar. (j) Gasdruck 15 bar. 
zu (a). 


Abbildung 6.22 (a): RGB-Bild von Kante 0987-1 mit ADB 0,5 mm, EM -1,0 mm, FP -0,5 mm, 
Gasdruck 18 bar, Vorschub 13 m/min. (b): Heatmap zu (a) für den Vorschub. (c) bzw. (d): 
Verbesserung durch Erhöhung des Vorschubs auf 17 bzw. 21 m/min. (e): Heatmap zu (a) für 
die Fokusposition. (f) bzw. (g): Veränderung durch höhere bzw. tiefere Fokusposition von 0,0 
bzw. -1,0 mm. (h): Heatmap zu (a) für den Vorschub. (i) bzw. (j): Veränderung durch höheren 
bzw. niedrigeren Gasdruck von 21 bzw. 15 bar. 
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(a) FP -1,0 mm. (b) Heatmap. (c) FP 0,0 mm. (d) FP 0,5 mm. 


Abbildung 6.23 (a): RGB-Bild von Kante 0882-4 mit ADB 1,5 mm, EM -2,5 mm, FP -1,0 mm, 
Gasdruck 12 bar. (b): Heatmap zu (a) für die Fokusposition. (c) bzw. (d): Verbesserung durch 
Erhöhung der Fokusposition auf 0,0 bzw. 0,5 mm. 


Dieses Beispiel veranschaulicht, wie die Unterstützung durch die LRP- 
Heatmaps aussehen könnte. Zunächst muss das unerwünschte Merkmal 
identifiziert werden. Dann wählt man die Heatmap aus, die den klarsten 
(positiven!) Zusammenhang damit aufweist. Die Veränderung des zugehö- 
rigen Prozessparameters wirkt sich sehr wahrscheinlich auf das störende 
Merkmal aus. Das verringert die Komplexität der Optimierungsaufgabe 
erheblich, auch wenn die Heatmaps die Richtung und die erforderliche 
Schrittweite der Parameteranpassung nicht vorgeben können. 

In den Abbildungen 6.23 und 6.24 sind zwei weitere Beispiele in Kurz- 
form gezeigt. Neben dem RGB-Bild ist jeweils lediglich die Heatmap abge- 
bildet, die den eindeutigsten Zusammenhang mit dem störenden Merkmal 
der Kante aufweist. Rechts daneben sind zwei Kanten gezeigt, die sich 
bei der Veränderung des zur Heatmap gehörenden Prozessparameters 
ergeben. 

Die Kante des Teils 0882 in Abbildung 6.23(a) könnte verbessert wer- 
den, indem die Spritzer in der oberen Hälfte eliminiert werden. Für die 
Klassifikation der Fokusposition -1,0mm waren die Spritzer relevant, 
wie die Heatmap in Abbildung 6.23(b) verdeutlicht. Die Anhebung des 
Strahlfokus von -1,0 auf 0,0 bzw. 0,5 mm verändert die gesamte Schnitt- 
fläche positiv, wie den nebenstehenden Abbildungen 6.23(c) und 6.23(d) 
zu entnehmen ist. Die Fokusposition wurde hier nur über eine Anpas- 
sung des Einstellmaßes verändert. Der ADB blieb unverändert, damit kein 
Quereinfluss der Gasdynamik auftreten konnte. 

Die in der Abbildung 6.24(a) gezeigte Kante des Teils 0663 könnte durch 
die Entfernung der Spritzer im mittleren Bereich verbessert werden. Da in 
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(a) Gasdruck 21 bar. (b) Heatmap. (c) Gasdruck 15 bar. (d) Gasdruck 12bar. 


Abbildung 6.24 (a): RGB-Bild von Kante 0663-1 mit ADB 2,0 mm, EM -1,0 mm, FP 1,0 mm, 
Gasdruck 21 bar, Vorschub 21 m/min. (b): Heatmap zu (a) für den Gasdruck. (c) bzw. (d): 
Verbesserung durch Verringerung des Gasdrucks auf 15 bzw. 12 bar. 


der Heatmap des Gasdruck-Klassifikators ein klarer Zusammenhang mit 
diesem Merkmal besteht (siehe Abbildung 6.24(b)), wurde er von 21 auf 15 
bzw. 12 bar verändert. Dadurch verschwinden die Spritzer. Das Resultat 
ist in den Abbildungen 6.24(c) bzw. 6.24(d) gezeigt. 

Auch wenn die Heatmaps für eine Verbesserung der Schnittkanten- 
qualität eingesetzt werden können, ist nicht garantiert, dass bei diesem 
Vorgehen ein Optimum aus Qualität, Stabilität und Produktivität erreicht 
wird. Nichtsdestotrotz könnten sie als Notfallmaßnahme sehr nützlich 
sein, wenn es darum geht, überhaupt weiterarbeiten zu können, wenn z. B. 
während einer Nachtschicht kein Fachpersonal zu erreichen ist. 


In den nächsten drei Abschnitten werden die Auswirkungen der Pro- 
zessparameter auf die Stabilität des Prozesses sowie auf die Qualität des 
Schneidergebnisses untersucht und modelliert. 


6.4.2 Analyse und Modellierung des Fehlschnittrisikos 


Eine verkürzte Fassung der dargestellten Ergebnisse wurde auf der Lasers 
in Manufacturing Konferenz 2019 vorgestellt [TP19]. 

Wie in Abbildung 6.25 für den ADB, die Fokusposition, den Gasdruck 
und den Vorschub gezeigt ist, wird das Fehlschnittrisiko (siehe Abschnitt 
5.3) von den Prozessparametern beeinflusst. Das Einstellmaß fehlt, da es 
bei der Darstellung von ADB und Fokusposition redundant ist. Um beim 
ADB den Einfluss auf die Fokusposition vom Einfluss auf die Gasdyna- 
mik zu trennen, ist das Fehlschnittrisiko über dem ADB für verschiedene 
Fokuspositionen aufgetragen. Bei der Interpretation der Zusammenhänge 
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Abbildung 6.25 Zusammenhänge zwischen dem Fehlschnittrisiko und den Prozessparame- 
tern. 


sollte man beachten, dass zu jeder auf der Abszisse aufgetragenen Faktor- 
stufe eines Prozessparameters alle Kombinationen der anderen Parameter 
vorliegen und dass darüber gemittelt wurde. Aufgrund des vollfaktori- 
ellen Versuchsplans liegen zu jeder Faktorstufe eines Prozessparameters 
dieselben Kombinationen der anderen Parameter vor. 

Wie Abbildung 6.25(a) zu entnehmen ist, hängt das Fehlschnittrisiko 
nur wenig vom Einfluss des ADBs auf die Gasdynamik ab. Es beträgt 
für tiefe Fokuspositionen über alle ADBs ca. 30 %. Bei der Fokusposition 
0,5 mm treten keine Fehlschnitte auf. Nur im mittleren Bereich bei einer 
Fokusposition von -0,5 mm besteht eine geringe Abhängigkeit vom ADB. 
Je näher sich die Düse am Blech befindet, desto instabiler wird der Prozess. 
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Die Fokusposition hat einen großen Einfluss auf die Stabilität des 
Schneidprozesses (siehe Abbildung 6.25(b)). Während bei einer Fokus- 
position von 0,5 mm, unabhängig von der Wahl der anderen Parameter, 
kein Fehlschnitt auftritt, beträgt der Anteil der Fehlschnitte bei einer Fo- 
kusposition von -3,0 mm 73 % und bei 2,5 mm 60 %. Die Position 0,5 mm 
über dem Blech scheint hinsichtlich der Prozessstabilität noch besser zu 
sein als der LIT-Wert (-0,5 mm). Die Empfehlung einer Fokusposition 
von -0,5 mm lässt sich dadurch erklären, dass sich der Strahlfokus mit 
zunehmender Erwärmung der Optiken in Richtung der Düse verschiebt 
(siehe Abschnitt 4.1.3). Da diese Erwärmung üblicherweise nicht kom- 
pensiert wird, ist es wichtig, dass dennoch ein stabiler Schneidprozess 
gewährleistet ist. 

Abbildung 6.25(c) zeigt den Einfluss des Gasdrucks auf das Fehlschnitt- 
risiko, welches mit steigendem Druck geringfügig ansteigt. Über der ge- 
samten Bandbreite beträgt der Unterschied ca. 9%. Dieses Ergebnis deckt 
sich mit dem Einfluss des ADBs, dessen Verringerung vermutlich mit einer 
Erhöhung des Gasdrucks einhergeht. 

Neben der Fokusposition hat der Vorschub den größten Einfluss. Bei 
einem langsamen Vorschub von 13m/min wird, unabhängig von der 
Wahl der anderen Parameter, stets so viel Energie absorbiert, dass das 
Blech getrennt werden kann. Je höher der Vorschub ist, desto wichtiger 
wird der Einfluss anderer Parameter und desto wahrscheinlicher wird 
ein Fehlschnitt. Der Vorschub verändert das pro Zeit zu schmelzende 
Volumen und wird durch die zur Verfügung stehende Prozessleistung 
limitiert (siehe Energiebilanz (2.1)). Der LTT-Wert (21 m/min) wurde nicht 
alleine aufgrund der Stabilität gewählt. Qualität und Produktivität waren 
auch wichtige Kriterien. Zur Minimierung des Fehlschnittrisikos sollten 
eine Fokusposition nahe der Blechoberkante und ein geringer Vorschub 
verwendet werden. Auch wenn die grundlegenden Auswirkungen eines 
Prozessparameters so veranschaulicht werden können, sollte man für die 
Interpretation der Aus- und Wechselwirkungen der Parameter auf ein 
Modell zurückgreifen. 


6.4.2.1 Prädiktion des Fehlschnittrisikos 


Für die Modellierung des Fehlschnittrisikos wird ein logistischer Regres- 
sionsansatz (3.4) verwendet. Das Ziel ist es, die Zugehörigkeit einer Pa- 
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Tabelle 6.11 Die Wahrheitsmatrix des Modells 4. Grades zur Fehlschnittprädiktion. 


Wahrheit 
FS KeinFS 
FS 97% 5% 


Vorhersage Kain FS 3% 95% 


rameterkombination zu einer der beiden Klassen Fehlschnitt (1) oder 
erfolgreicher Schnitt (0) vorherzusagen. Als Eingangsdaten dienen die Pro- 
zessparameter sowie deren polynomiale Erweiterungen (siehe Abschnitt 
5.3). 

In Abbildung 6.26(a) ist die Modellgüte, beschrieben durch Precision 
und Recall (siehe Abschnitt 3.1.2), für verschiedene polynomiale Erwei- 
terungen der Eingangsgrößen zu sehen. Die Modellgüte steigt zunächst 
von Grad 1 zu 2 steil an und verbessert sich dann nur noch langsam. Im 
Folgenden wird die polynomiale Erweiterung 4. Grades verwendet, da für 
höhere Grade die Überanpassung zunimmt. 

Die Wahrheitsmatrix dieses Modells ist in Tabelle 6.11 zu sehen. 95 % 
der erfolgreichen Schnitte werden korrekt klassifiziert und 5% werden 
als Fehlschnitt eingeordnet. Von den Fehlschnitten werden 97 % korrekt 
vorhergesagt, 3% werden fälschlicherweise als erfolgreicher Schnitt ein- 
geschätzt. Der Recall des Modells liegt in allen Fällen über der Precision. 
Dies ist sinnvoll, da ein guter Schnitt, der fälschlicherweise als Fehlschnitt 
eingeschätzt wird, deutlich unproblematischer ist als umgekehrt. 

Insgesamt hat das Modell 4. Grades 69 erlernte Koeffizienten. Die größ- 
ten 13 beinhalten jedoch gut die Hälfte der Gesamtrelevanz. Die Geschwin- 
digkeit sowie die Fokuslage sind jeweils in zehn der 13 Eingangsmerkmale 
mit den größten Koeffizienten enthalten, der Gasdruck und der ABD in 
fünf bzw. zwei. Die Dominanz des Vorschubs und der Fokuslage deckt 
sich mit den oben beschriebenen Zusammenhängen. 


Interpretation Ein solches Modell zur Prädiktion von Fehlschnitten bzw. 
der Quantifizierung der Prozessstabilität könnte als Grundlage für die 
Optimierung der Prozessparameter dienen, da es die Grenzen des nutz- 
baren Parameterraums aufzeigt. In Abbildung 6.26(b) ist das mithilfe 
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(c) ADB 1,5 mm, Fokusposition -0,5 mm. (d) Fokusposition -0,5 mm, Gasdruck 15 bar. 
Abbildung 6.26 Güte verschiedener Modelle für die Prädiktion des Fehlschnittrisikos: (a). 


Mit dem Modell 4. Grades berechnetes Fehlschnittrisiko: (b), (c), (d). Es ist zu beachten, dass 
in den verschiedenen Grafiken unterschiedliche Farbskalen verwendet werden. 
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des Modells berechnete Fehlschnittrisiko über Vorschub und Fokuspo- 
sition für den LTT-Gasdruck von 15bar und den LTT-ADB von 1,5 mm 
zu sehen. Je höher der Vorschub ist, desto kleiner ist die Bandbreite der 
Fokusposition, innerhalb der das Material getrennt werden kann. Bei der 
Positionierung des Strahlfokus direkt an der Oberkante kann das Blech 
mit dem höchstmöglichen Vorschub getrennt werden, weil die einfallende 
Leistungsdichte maximal ist [WK11]. Ebenfalls gezeigt sind die Abhängig- 
keiten des Fehlschnittrisikos von Vorschub und Gasdruck bzw. Vorschub 
und ADB in den Abbildungen 6.26(c) und 6.26(d). Die anderen Prozesspa- 
rameter entsprechen dabei den LTT-Werten. Dass der Gasdruck und der 
Abstand zwischen Düse und Blech die erreichbare Schneidgeschwindig- 
keit nicht beeinflussen, wurde beispielsweise auch von Borkmann et al. 
[BMB18] experimentell bestätigt. Man sollte jedoch nicht schlussfolgern, 
dass die Gasdynamik keinen Einfluss auf die Trennbarkeit des Materials 
hat. Die Effektivität des Laserschneidprozesses wird maßgeblich durch 
die Schmelz- und die Materialentfernungsrate beeinflusst [WK10]. Die 
Fokusposition, welche einen großen Einfluss auf das Fehlschnittrisiko hat, 
beeinflusst aber nicht nur die Schmelzrate, sondern sie verändert auch die 
Breite und Form des Schnittspalts und damit die Gasdynamik und die 
Materialentfernungsrate [BMB18]. Der Ubergangsbereich zwischen einem 
geringen und einem hohen Fehlschnittrisiko ist sehr schmal. In diesem 
Bereich liegen alle Parameterkombinationen aus Tabelle 6.1, mit denen das 
Blech einmal getrennt werden konnte und einmal nicht. 


6.4.3 Analyse und Modellierung der Rautiefe 


In Abbildung 6.27 ist die Rautiefe für die oberste (03), mittlere (15) und 
unterste (27) Messlinie sowie gemittelt über alle neun Messlinien (ges.) 
gezeigt. Über einer Faktorstufe wurde jeweils der Median der Rautiefen- 
werte aufgetragen. Anders als in Abbildung 6.25 liegen hier — aufgrund 
der Parameterabhängigkeit der Fehlschnitte - für die verschiedenen Fak- 
torstufen eines Prozessparameters teilweise verschiedene Kombinationen 
der anderen Parameter vor. Dadurch kann es zu Quereinflüssen kommen. 
Das ist ein weiterer Grund, warum Modelle bei der Interpretation der Aus- 
und Wechselwirkungen hilfreich sein können. 
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Abbildung 6.27 Zusammenhänge zwischen der Rautiefe auf verschiedenen Messlinien und 
den Prozessparametern. 


Wie in den Abbildungen 6.27(a) und 6.27(c) zu sehen ist, beeinflusst eine 
Veränderung des ADBs und des Gasdrucks die Rautiefe kaum. Es scheint 
lediglich einen kleinen positiven Einfluss bei der Erhöhung des Gasdrucks 
zu geben. 

Einen großen Einfluss auf die Rautiefe aller Messlinien hat die Fokus- 
position. Dies ist in Abbildung 6.27(b) gezeigt. Im oberen Bereich der 
Schnittkante nimmt die Rautiefe mit größer werdender Fokusposition ten- 
denziell ab. Besonders kleine Rz-Werte treten bei —0,5 und 2,0 mm auf. Im 
mittleren Bereich tritt ein Plateau niedriger Rautiefe für Fokuspositionen 
zwischen —1,0 und 2,0 mm auf. Außerhalb nimmt die Rautiefe deutlich zu. 
Im unteren Bereich der Schnittkante wird die Kante bei einer Erhöhung 
der Fokusposition von -3,0 auf -1,0 mm glatter. Der Rz-Wert stagniert 
dann bei ca. 15 um. Die durchschnittliche Rautiefe verändert sich weniger 


162 


6.4 Erweiterung des Prozessverständnisses 


stark als die Werte einzelner Messlinien, deren Verhalten sich im Mittel 
teilweise kompensiert. Sie ist besonders klein für Fokuspositionen um 
-1,0 mm und oberhalb von 1,5 mm. Abbildung 6.27(b) zeigt, dass der LTT- 
Wert von -0,5 mm ein durchaus sinnvoller Kompromiss für eine mittlere 
bis niedrige Rautiefe in allen Bereichen ist. Selbst wenn sich der Fokus 
aufgrund thermischer Effekte von dort aus nach oben bewegt, bleibt die 
Rautiefe der Schnittkante unverändert. 

Der Einfluss des Vorschubs ist in Abbildung 6.27(d) zu sehen. Die Ver- 
änderungen der Rautiefe liegen in allen Bereichen bei 5 um oder weniger 
über der gesamten Bandbreite. 


6.4.3.1 Modellierung der Rautiefe 


Der Zusammenhang zwischen den Prozessparametern und der durch- 
schnittlichen Rautiefe wird mittels linearer Regression (3.3) mit polynomia- 
len Kombinationen der Prozessparameter modelliert. Weitere Ergebnisse 
zur Modellierung der Rautiefe auf den Messlinien 03, 15 bzw. 27 sind im 
Anhang A.6 zu finden. 

In Abbildung 6.28(a) ist die Modellgüte durch den mittleren absoluten 
Fehler für verschiedene polynomiale Erweiterungen jeweils separat für 
die Trainings- und Testdaten beschrieben. Die Entscheidung fiel hier, wie 
bei der Modellierung des Fehlschnittrisikos, auf die polynomiale Erweite- 
rung 4. Grades, da diese einen guten Kompromiss aus höchstmöglicher 
Güte und kleinstmöglicher Überanpassung darstellt. Der mittlere absolute 
Fehler beträgt 1,6 um im Training und 1,7 um für unbekannte Parameter- 
kombinationen. Der (theoretische) Fehler eines Modells, welches im Test 
stets den Mittelwert der Rautiefe der Trainingsdaten vorhersagt, wäre 
3pm. 

Insgesamt hat das Modell 4. Grades 69 erlernte Koeffizienten. Wahrend 
bei der Prädiktion des Fehlschnittrisikos die 13 größten Koeffizienten 
gleichviel Einfluss haben wie die 56 kleinsten, sind es hier die 20 größten 
bzw. 49 kleinsten. Die Fokusposition ist in 16 dieser 20 Eingangsvariablen 
enthalten, der Vorschub in elf, der Gasdruck in zehn und der ADB in drei. 
Hier ist die Fokusposition die dominierende Einflussgröße. 


Interpretation In Abbildung 6.28(b) ist die vom Modell geschätzte Rau- 
tiefe in Abhängigkeit des Vorschubs und der Fokusposition zu sehen. Die 
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nicht variierten Prozessparameter entsprechen jeweils dem LTT-Wert. Der 
Fokusbereich, in dem kleine Rautiefenwerte erzielt werden, wird mit zu- 
nehmender Schneidgeschwindigkeit etwas kleiner. Die Zunahme der Rau- 
tiefe in Abhängigkeit der Fokusposition bei einer festen Geschwindigkeit 
verhält sich ungefähr symmetrisch zur Fokusposition 0. Dies entspricht 
einem Strahlfokus an der Oberkante des Blechs. Besonders glatte Kanten 
sind bei einem niedrigen Vorschub und einer Fokusposition 1,0 mm unter- 
und oberhalb der Blechoberfläche möglich. Dass die Rautiefe besonders 
niedrig ist, wenn sich der Laserstrahl langsam bewegt, könnte daran lie- 
gen, dass in diesem Fall ein sehr breiter Schnittspalt entsteht, welcher 
die Aufrechterhaltung einer laminaren Strömung ermöglicht, was sich 
glättend auswirkt [WK10]. Die Rautiefe ist groß, wenn der Strahlfokus 
tief im Blech positioniert ist. Es ist jedoch zu beachten, dass das mögliche 
Prozessfenster für diese Fokuspositionen mit steigendem Vorschub kleiner 
wird und Teile mit einer Fokusposition unter —2,0 mm nicht schneller ge- 
schnitten werden können als mit 21 m/min. Die Abbildung 6.28(b) sollte 
deshalb stets nur unter Zuhilfenahme von Abbildung 6.26(b) interpretiert 
werden. Wie in den Abbildungen 6.28(c) und 6.28(d) zu sehen ist, besteht 
nur ein geringer Zusammenhang zwischen ADB bzw. Gasdruck und Rau- 
tiefe. Es bestätigt sich aber der Zusammenhang, dass sich ein größerer 
Gasdruck oder ein kleinerer ADB positiv auf die Rautiefe auswirken, weil 
dadurch vermutlich die Aufrechterhaltung der laminaren Strömung im 
gesamten Schnittspalt begünstigt wird. 


6.4.4 Analyse und Modellierung des Grats 


In Abbildung 6.29 sind die Zusammenhänge zwischen der Grathöhe und 
den Prozessparametern visualisiert. Über einer Faktorstufe wurde jeweils 
der Median der Grathöhenwerte aufgetragen. 

Der ADB hat, abhängig von der Fokusposition, keinen oder einen großen 
Einfluss auf die Gratbildung. Je tiefer im Blech der Strahlfokus positioniert 
ist, desto größer ist der Einfluss der Gasdynamik, die durch den ADB 
verändert wird. Mit kleiner werdendem ADB wächst der Grat. Es ist davon 
auszugehen, dass sich der Druck im Schnittspalt erhöht, wenn sich die 
Düse näher an die Blechoberseite befindet. Wie man in Abbildung 6.29(c) 
sieht, sorgt auch eine Erhöhung des Gasdrucks für eine zunehmende 
Gratbildung. 
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(b) ADB 1,5 mm, Gasdruck 15 bar. 
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(d) ADB 1,5 mm, Fokusposition —0,5 mm. 


Abbildung 6.28 Güte verschiedener Modelle für die Prädiktion der Rautiefe: (a). Mit dem 
Modell 4. Grades berechnete Rautiefe: (b), (c), (d). Es ist zu beachten, dass in den verschiede- 
nen Grafiken unterschiedliche Farbskalen verwendet werden. 
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Abbildung 6.29 Zusammenhänge zwischen der Grathöhe und den Prozessparametern. 


Die Fokusposition ist wie beim Fehlschnittrisiko und bei der Rautiefe 
eine entscheidende Einflussgröße. Insbesondere sehr tiefe Fokuspositionen 
verursachen sehr hohe Grate. Von -1,0 bis 1,0 mm verändert sich die 
Grathöhe kaum. Die Ausbildung eines Plateaus in diesem Bereich war 
auch bei der Rautiefe zu beobachten. 

Der Vorschub hat ebenfalls einen großen Einfluss auf die Gratbildung. 
Die Grathöhe nimmt steil ab bei einer Erhöhung des Vorschubs von 13 auf 
21m/min. 

Die Gegenüberstellung der Abbildungen 6.25(d) und 6.29(d) zeigt, wie 
schwierig die Optimierung der Prozessparameter ist. Für ein geringes 
Fehlschnittrisiko sollte tendenziell ein niedriger Vorschub gewählt werden. 
Dieser verursacht jedoch eine starke Gratbildung. 
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6.4.4.1 Modellierung der Grathöhe 


Der Zusammenhang zwischen den Prozessparametern und der Grathöhe 
wird wieder mittels linearer Regression abgebildet. Polynomiale Kombi- 
nationen der Prozessparameter werden als Eingangsvariablen verwendet. 

In Abbildung 6.30(a) ist die Modellgüte beschrieben durch den mittle- 
ren absoluten Fehler für verschiedene polynomiale Erweiterungen jeweils 
separat für Trainings- und Testdaten ausgewertet. Auch hier fiel die Ent- 
scheidung auf die polynomiale Erweiterung 4. Grades. Der MAE beträgt 
27 um im Training und 30 um für unbekannte Parameterkombinationen. 
Der Fehler eines Modells, welches im Test stets den Grathöhenmittelwert 
der Trainingsdaten vorhersagt, wäre 76 um. 

Insgesamt hat das Modell 69 erlernte Koeffizienten. 17 Koeffizienten 
beinhalten die Hälfte der Gesamtrelevanz. Die Fokuslage ist in zwölf dieser 
17 Variablen enthalten, der Vorschub in acht, der Gasdruck in sieben und 
der ABD in vier. Hier stellt auch die Gasdynamik einen wichtigen Einfluss 
dar. 


Interpretation Die Zusammenhänge zwischen der vom Modell vorherge- 
sagten Grathöhe in Abhängigkeit des Vorschubs und der Fokusposition für 
einen ADB von 1,5 mm und einen Gasdruck von 15 bar sind in Abbildung 
6.30(b) zu sehen. Da dieses Modell die Grenzen des Prozessbereichs nicht 
kennt, sollte diese Abbildung nur gemeinsam mit Abbildung 6.26(b) ver- 
wendet werden. Beim Vergleich dieser beiden Abbildungen fällt auf, dass 
kleine Grathöhen vor allem an der Grenze zum nicht schneidbaren Bereich 
auftreten. Bei hohen Schneidgeschwindigkeiten ist der Wärmeverlust in 
das umgebende Material besonders klein. Dies führt zu einer höheren 
Temperatur und damit zu einer besseren Fließfähigkeit der Schmelze, ver- 
einfacht die Materialentfernung und führt dadurch wahrscheinlich zu 
einem kleineren Grat [WK10]. Bei einem niedrigen Vorschub ist der Grat 
dagegen hoch. Besonders große Gratperlen entstehen bei einem niedri- 
gen Vorschub in Kombination mit einer ungünstigen Fokusposition von 
über 1,0 oder unter -2,0 mm. In den Abbildungen 6.30(c) und 6.30(d) zeigt 
sich ein gegenüber der Rautiefe gegensätzliches Verhalten. Während ein 
niedriger ADB und ein hoher Gasdruck bei geringen Geschwindigkei- 
ten zu einer verminderten Rautiefe führen (siehe Abbildung 6.28(c) bzw. 
6.28(d)), kommt es zu einer Zunahme der Grathöhe. Auch hier muss also 


167 


6 Ergebnisse und Diskussion 


Grathöhe in um 
E> 


E 0 50 100 150 200 
= 
& 
g 
2 
D 
7) 
[e] 
Q 
5 
4 
EB #17 2 2 29 
Grad Vorschub in m/min 
(a) Mittlerer absoluter Fehler für verschiedene po- (b) ADB 1,5 mm, Gasdruck 15 bar. 
lynomiale Erweiterungen. 
Grathöhe in um Grathöhe in um 
> ka» 
30 30 50 100 150 200 30 50 100 150 200 
g 25 E 
E zi £ 
g” Š 
m 1,5} z 
Q 10 E 
< ý o 
0,5 O : 
13 17 21 25 29 13 17 21 25 29 
Vorschub in m/min Vorschub in m/min 
(c) Fokusposition —0,5 mm, Gasdruck 15 bar. (d) ADB 1,5 mm, Fokusposition —0,5 mm. 


Abbildung 6.30 Güte verschiedener Modelle für die Pradiktion der Grathöhe: (a). Mit dem 
Modell 4. Grades berechnete Grathöhe: (b), (c), (d). 
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— 1 mm — 1 mm 


(a) Optimierung von Stabilität und Rautiefe. Kante (b) Minimierung der Grathöhe. Kante 0838-1. 
0546-1. 


Abbildung 6.31 Exemplarische Kanten für unterschiedliche Präferenzen. 


ein Kompromiss zwischen verschiedenen Qualitätsmerkmalen gefunden 
werden. Allerdings verursachen ADB und Gasdruck beim Grat Ände- 
rungen im dreistelligen um-Bereich, während bei der Rautiefe nur kleine 
Unterschiede auftreten. 


6.4.5 Praktische Anwendung der Modelle 


Mit den oben beschriebenen Modellen für die Prozessstabilität, die mittlere 
Rautiefe und die Grathöhe wäre es möglich, die Prozessparameter an 
individuelle Kundenwünsche anzupassen. Die Präferenzen hinsichtlich 
verschiedener Prozessmerkmale könnten genutzt werden, um die Modelle 
zu gewichten. Basierend auf der gewichteten (und normierten) Summe der 
Modelle, könnte eine individuell optimale Prozessparameterkombination 
berechnet werden. Das Modell für die Prädiktion des Fehlschnittrisikos 
würde die Randbedingungen für diese Optimierung vorgeben. 

Bei gleicher Gewichtung von Stabilität und Rautiefe würde die Kante bei- 
spielsweise wie die in Abbildung 6.31(a) gezeigte aussehen. Diese wurde 
mit einem Vorschub von 13m/min und einer Fokusposition von -0,5 mm 
geschnitten. ADB und Gasdruck entsprachen den LTT-Werten. Die Kante 
weist allerdings einen deutlichen Grat auf. Soll nur die Grathöhe optimiert 
werden, würde sich z.B. die in Abbildung 6.31(b) gezeigte Kante ergeben. 
Hier betrug der Vorschub 25 m/min, die Fokusposition 1,0 mm. ADB und 
Gasdruck entsprachen ebenfalls LTT-Werten. In diesem Fall befindet man 
sich allerdings bereits nahe an der Grenze zum nicht schneidbaren Bereich 
(siehe Abbildung 6.26(b)). Diverse andere Gewichtungen der Merkmale 
sind denkbar. Zusätzlich sollten weitere Qualitätskriterien einbezogen 
werden, z.B. die Homogenität und die Verfärbung (siehe Abschnitt 6.2.1). 
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Die visualisierten Zusammenhänge könnten außerdem bei der manu- 
ellen Ermittlung geeigneter Prozessparameter helfen, indem sie erstens 
aufzeigen, mit welchem Parameter die größten Veränderungen erzielt wer- 
den können und zweitens die Richtung vorgeben, wie welcher Parameter 
je nach Präferenz eingestellt werden sollte. 
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In Kapitel 1 der vorliegenden Arbeit wurden drei Anforderungen an die 
fertigende Industrie formuliert: Eingehen auf individuelle Kundenwün- 
sche, sparsame Nutzung von Ressourcen und günstige Stückkosten auch 
für kleine Losgrößen. Obwohl das Laserschneiden aufgrund seiner Fle- 
xibilität gut geeignet wäre, diesen Anforderungen zu begegnen, ist man 
ihnen mit der heutigen Arbeitsweise nicht gewachsen. Alle erarbeiteten 
Ergebnisse zielen deshalb auf eine Verbesserung eines oder mehrerer der 
genannten drei Punkte ab. Aufgrund des großen Erfolgs der Methoden 
des maschinellen Lernens in verschiedensten Bereichen und weil diese Me- 
thoden bislang nur wenig Anwendung im Laserschneiden finden, wurden 
in dieser Arbeit ausschließlich datenbasierte Modellansätze verwendet. 
Es ging dabei auch darum, das Potential des maschinellen Lernens für 
Anwendungen im Laserschneiden aufzuzeigen. 

Da zu Beginn der Arbeit keine Daten vorhanden waren, musste zu- 
nächst eine breite Datenbasis erzeugt werden. Es wurden 1126 Teile mit 
verschiedenen Prozessparameterkombinationen geschnitten. Sofern bei 
einem Teil kein Fehlschnitt auftrat und es aus dem Restgitter entnom- 
men werden konnte, wurden von jeder Schnittkante RGB-Bilder und 3D- 
Punktwolken aufgenommen. Aus den 3D-Punktwolken konnten objektive 
Qualitätsmerkmale wie Rautiefe und Grathöhe abgeleitet werden. Ergänzt 
wurden diese mit den subjektiven Qualitätsbewertungen durch Experten. 
Die Qualität der Datenbasis wurde analysiert und es wurden verschie- 
dene Methoden zur Korrektur von Rautiefenmessfehlern evaluiert. Die 
größte Verbesserung der Datenqualität konnte durch zweimaliges Vermes- 
sen jeder Kante erzielt werden. Fast genauso gute Resultate lieferte die 
Korrektur der Messdaten eines Durchgangs mit einem Autoencoder. 

Die durchgeführte Expertenbefragung zeigte, dass kein allgemein gülti- 
ges Qualitätsverständnis angenommen werden kann und man stattdessen 
auf individuelle Präferenzen eingehen sollte, weil die Bewertung dersel- 
ben Schnittkante durch verschiedene Personen teils sehr unterschiedlich 
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ausfiel. Die Rauheit, die Homogenität und die Grathöhe waren für alle 
bewertenden Personen wichtig. Die Verfärbung der Schnittkante war da- 
gegen für manche Personen relevant und für andere nicht. Interessant 
war, dass viele als gut bewertete Schnittkanten mit gegenüber dem LTT- 
Wert erhöhten Vorschüben geschnitten wurden. Bei einer verbesserten 
Kontrollierbarkeit des Gesamtprozesses und der Maschine könnte man 
Sicherheitsfaktoren verkleinern, schneller schneiden und so eine besse- 
re Qualität und gleichzeitig eine höhere Produktivität erreichen. Bei der 
Expertenbefragung zeigte sich außerdem, dass Menschen generell Schwie- 
rigkeiten haben, die Qualität der Schnittfläche einer Kante zu beurteilen. 
Deshalb sollte die subjektive Beurteilung durch objektive Kenngrößen 
ergänzt werden. Zu diesem Zweck wurde ein faltendes neuronales Netz 
entwickelt, mit dem die Rautiefe einer Schnittkante basierend auf einem 
RGB-Bild geschätzt werden kann, damit sie auch ohne ein teures Mess- 
gerät zur Verfügung steht. Es zeigte sich, dass es prinzipiell möglich ist, 
den Zusammenhang zwischen Bild und Rautiefe zu erlernen. Gleichzeitig 
konnte an diesem Beispiel gezeigt werden, wie wichtig die Qualität der 
Trainingsdaten für die Modellgüte ist. Das auf den unbereinigten Messda- 
ten trainierte CNN schätzte die Rautiefe systematisch schlechter ein, als 
das auf den (mit dem Autoencoder) korrigierten Daten trainierte Netz. 
Ein CNN eröffnet außerdem eine neue Möglichkeit, den Zustand ei- 
ner Laserschneidmaschine zu überprüfen. Mithilfe des Netzes können 
die einer Schnittkante zugrunde liegenden Prozessparameter ausgehend 
von einem RGB-Bild geschätzt werden. Besteht eine Differenz zwischen 
diesen Ist-Prozessparametern und den eingestellten Soll-Parametern, liegt 
ein Problem in der Maschine vor. Die Kenntnis des betroffenen Parame- 
ters verkleinert den Suchraum erheblich und verkürzt so die Arbeits- 
und die Maschinenstillstandszeit. Dadurch können teure Fachkräfte effi- 
zienter eingesetzt und die Maschinen produktiver betrieben werden. Da 
voll automatisierte Laserschneidmaschinen mit dieser Methode dauerhaft 
überwacht werden können, kann die Maschine bei Problemen angehalten 
und eine aufwendige Nachbearbeitung vermieden werden. Die Bestim- 
mung der Schneidparameter aus dem RGB-Bild gelang besonders gut für 
Vorschub und Fokusposition und etwas weniger gut für den Abstand zwi- 
schen Düse und Blech, das Einstellmaß und den Gasdruck. Da Menschen 
angesichts der großen Komplexität des Prozesses nicht in der Lage sind, 
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von der Schnittkante auf die Prozessparameter zu schließen, zeichnete 
sich das große Potential der Methoden des maschinellen Lernens für das 
Laserschneiden hier besonders deutlich ab. 

CNNs, die ein Bild der Schnittkante der Faktorstufe eines Prozesspa- 
rameters zuordnen, können zusammen mit einer geeigneten Visualisie- 
rungsmethode dazu genutzt werden, das Prozessverständnis zu erweitern. 
Das ist eine wichtige Voraussetzung für die Herstellung kleiner Losgrößen 
zu günstigen Preisen. Mit der Layer-wise Relevance Propagation können 
die für die Entscheidung des Netzes wichtigsten Pixel des Eingangsbildes 
in einer Heatmap deutlich gemacht werden. So wird für den Menschen 
verständlicher, was innerhalb des neuronalen Netzes passiert. Die Heat- 
maps können auch als erste Hilfe bei Schneidproblemen genutzt werden. 
Treten beispielsweise unerwünschte Spritzer auf der Kante auf und zeigt 
die Visualisierung an, dass dieses Merkmal besonders wichtig für die 
Erkennung des Gasdrucks war, folgt umgekehrt, dass der Gasdruck die- 
ses Merkmal besonders stark beeinflusst und die Spritzer verschwinden, 
wenn er geändert wird. 

Ein weiterer Beitrag zur Erweiterung des Prozessverständnisses sind 
die detaillierten Analysen und die Modellierung der Zusammenhänge 
zwischen den Prozessparametern und den drei Merkmalen Fehlschnittri- 
siko, Rautiefe und Grathöhe. Die Modellierung dieser Zusammenhänge 
auf dem Fundament der breiten Datenbasis, die alle Wechselwirkungen 
der variierten Prozessparameter beinhaltet, bietet gleich mehrere Anwen- 
dungsmöglichkeiten. Die Modelle zeigen, wie schwierig die Optimierung 
des Laserschneidprozesses ist, weil stets ein Kompromiss gefunden wer- 
den muss zwischen Prozessstabilität, verschiedenen Qualitätsmerkmalen 
und der Produktivität. Beispielsweise wird die Grathöhe an der Gren- 
ze des schneidbaren Parameterraums minimal. Die Modelle können bei 
der manuellen Suche nach einem geeigneten Kompromiss unterstützen, 
weil sie alle Aus- und Wechselwirkungen der Parameter transparent ma- 
chen. Eine weitere Einsatzmöglichkeit ist die individuelle Optimierung des 
Schneidprozesses. Die Modelle ermöglichen die Berechnung einer perso- 
nalisierten Prozessparameterkombination basierend auf der individuellen 
Gewichtung der Prozess- und Qualitätsmerkmale ohne eine aufwendige 
experimentelle Anpassung. Die Kosten wären dann unabhängig von der 
Stückzahl. 
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7.1 Ausblick 


Für eine sinnvolle multikriterielle Optimierung des Schneidprozesses 
sollten die Zielfunktionen Fehlschnittrisiko, Rautiefe und Grathöhe erwei- 
tert werden durch eine Größe, die die vom Menschen wahrgenommene 
Homogenität quantifiziert sowie durch die Verfärbung und die Rechtwink- 
ligkeitstoleranz. 

Um eine Vorstellung der tatsächlichen Bandbreite bei der Qualitätsbe- 
wertung von Schnittkanten zu erhalten, sollte die Befragung auf Personen 
unterschiedlicher Branchen in verschiedenen Märkten ausgeweitet wer- 
den. Außerdem wäre es sinnvoll, den vorhandenen Maschinenpark zur 
Nach- und Weiterbearbeitung einzubeziehen. 

Alle in der vorliegenden Arbeit präsentierten Ergebnisse wurden auf 
derselben Datenbasis entwickelt. Diese besteht nur aus Edelstahl- 
Schnittkanten der Blechdicke 3mm, die auf einer Maschine mit verschiede- 
nen Kombinationen von vier Prozessparametern geschnitten wurden. Die 
wichtigsten nächsten Schritte sind deshalb die Untersuchung der Übertrag- 
barkeit auf andere Blechdicken, andere Materialien und andere Maschinen 
sowie die Einbeziehung zusätzlicher Prozessparameter. Die Hinzunahme 
jeder weiteren Einflussgröße erhöht jedoch die Komplexität und vergrö- 
ßert die erforderliche Datenmenge. Des Weiteren sollte die Datenqualität, 
insbesondere bei der Erfassung der 3D-Punktwolken, verbessert werden. 

Da diese Arbeit nicht eine Nische eines bereits gut erforschten Gebietes 
behandelt, sondern ein neues Anwendungsgebiet datenbasierter Metho- 
den eröffnet, ergibt sich daraus eine Vielzahl an weiteren Fragestellungen, 
die weit über die bisherige Datenbasis und die beschriebenen Erweiterun- 
gen herausgehen. 
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A.1 Technische Daten 


In diesem Abschnitt sind die technischen Daten der verwendeten La- 
serschneidmaschine und der Strahlquelle (siehe Tabelle A.1) sowie des 
Keyence Messgeräts VR-3200 (siehe Tabelle A.2) aufgelistet. Außerdem 
werden Angaben zur Hardware (siehe Tabelle A.3) und den eingesetzten 
Python-Bibliotheken gemacht (siehe Tabelle A.4). 


Tabelle A.1 Technische Daten der Laserschneidmaschine TruLaser 5030 fiber (L68) und der 
Strahlquelle TruDisk 12001 von TRUMPF. Quelle: TRUMPF. 


Arbeitsbereich x 3000 mm 
Arbeitsbereich y 1500 mm 
Maximale Geschwindigkeit 280 m/min 
Maximale Blechdicke Edelstahl 40 mm 
Wellenlänge 1030 nm 


Strahlparameterprodukt (vor Lichtleitkabel) 4mm mrad 
Numerische Apertur (nach Lichtleitkabel) 0,1 
Kontinuierlich einstellbarer Leistungsbereich 240 W bis 12kW 
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Tabelle A.2 Technische Daten des Messgeräts VR-3200 der Keyence Corporation im Modus 
40-fache Vergrößerung. Quelle: Keyence Corporation. 


Betrachtungsmessbereich 7,6 mm x 5,7 mm 

Messbare Höhe +0,5 mm 

Wiederholbarkeit 0,5 um (Höhe), 0,5 um (Breite) 
Messgenauigkeit +3 um (Höhe), +2 um (Breite) 
XY-Hub Messtisch 184mm x 88 mm 

Z-Hub Messtisch 90 mm 

Bildaufnahmeelement 4 Mio. Pixel CMOS, monochrom 
Projektionsobjektive Doppelt telezentrisch 


Lichtempfangendes Objektiv Doppelt telezentrisch 
Lichtquelle für Betrachtung Ringleuchte (rot/grün/blau) 
Lichtquelle für Messung Weiße LED 


Tabelle A.3 Verwendete Hardware zum Training der ML-Modelle. 


Prozessor Intel® Core™ i9 Ten, i9-9820X 
Arbeitsspeicher 64 GB-Corsair VENGEANCE DDR4 3000 MHz 
Grafikkarte GB-NVIDIA GeForce RTX 2080 Ti 


Tabelle A.4 Wichtige verwendete Python-Bibliotheken mit Versionsnummer. 


Bibliothek Version 
Python 3.7.3 
Keras [Cho15] 2.2.4 
NumPy [Har+20] 1.16.2 
Matplotlib [Hun07] 3.0.3 
pandas [McK10] 0.24.2 
OpenCV [Bra00] 3.4.1 


scikit-learn [Ped+11] 0.20.3 
TensorFlow [Aba+16] 1.13.1 
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A.2 LTT-Teile 
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Abbildung A.1 RGB-Bilder der Schnittflache von Kante 2 aller LTT-Teile. Gezeigt ist jeweils 
ein ca.3mm x 3mm großer Ausschnitt. 
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A.3 Schnittkanten der Teile 0949, 0992, 1006, 
1056, 1077 


(Sustains a 


(c) 0949-3. 


(e) 0992-1. 


Seip eee he 
| Rt 


‘ANY 


(p) 1056-4. 


(q) 1077-1. (r) 1077-2. (s) 1077-3. (t) 1077-4. 


Abbildung A.2 Ergänzung zu Tabelle 6.6: RGB-Bildausschnitte der Teile 0949, 0992, 1006, 
1056 und 1077 jeweils mit den Kanten -1, -2, -3 und -4. Gezeigt ist jeweils ein ca. 3mm x 
3 mm großer Ausschnitt. 
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A.4_ LRP-Regeln 


Dieser Abschnitt schließt an die Herleitung der LRP über die Deep Taylor 
Decomposition in Abschnitt 5.2.1 an. 

Es gibt verschiedene Regeln für die Rückpropagation der Relevanz. Die- 
se haben gegenüber Formel (5.12) beispielsweise vorteilhafte numerische 
Eigenschaften (e/Yy-Regel) oder sie berücksichtigen, dass nicht beliebige re- 
elle Zahlen als Eingangswerte einer Schicht zugelassen sind (0/ z”-Regel). 
Dafür müssen die Forderungen nach Erhaltung (5.1) und Positivität (5.2) 
teilweise gelockert werden. 


LRP-0-Regel: Die LRP-0-Regel ergibt sich, wenn nicht alle reellen Zahlen 
zugelassen sind und im Intervall (0, {a;}) nach der Entwicklungsstelle 
gesucht wird. Gesucht wird dabei entlang des Vektors selbst (und nicht 
entlang des Gradienten) in Richtung des Ursprungs. Es gilt [Bac+15]: 


R; = 2 = 7 Rj mit Žij = a; Wiz . (A.1) 


Auch wenn diese Regel auf den ersten Blick sinnvoll scheint, hat sich ge- 
zeigt, dass ihre Anwendung auf das gesamte neuronale Netz der Multipli- 
kation des Gradienten mit dem Eingang entspricht [SGK17]. Der Gradient 
tiefer neuronaler Netze ist jedoch üblicherweise verrauscht [Bal+17], was 
zu schwierig interpretierbaren Heatmaps führt. Die LRP-0-Regel ist außer- 
dem numerisch instabil. Bach et al. [Bac+15] und Montavon et al. [Mon+17; 
Mon+19] haben deshalb modifizierte Regeln mit besseren numerischen 
Eigenschaften entwickelt. 


LRP-e-Regel: Ergänzt man e im Nenner der LRP-0-Regel, ergibt sich der 
folgende Zusammenhang [Bac+15]: 


= Ben fy a 


Die Ergänzung von e sorgt für numerische Stabilität. Die resultieren- 
den Heatmaps sind weniger verrauscht, die Relevanz einiger Pixel ver- 
schwindet jedoch, weil e kleine Beiträge absorbiert. In dieser Arbeit wurde 
e = 0,25 verwendet. 
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LRP-y-Regel: Diese Regel entspricht der LRP-0-Regel, aber z;; verändert 
sich zu [Mon+19]: 


Zij = a; (wij +Y: wih) . (A.3) 


Dadurch werden die positiven Beiträge w gegenüber den negativen 
bevorzugt. Diese Bevorzugung fällt umso stärker aus, je größer y ist. Die 
Übergewichtung der positiven Beiträge erhöht die Stabilität, kann jedoch 
dazu führen, dass eher unwichtige Merkmale auch als relevant angezeigt 
werden. In dieser Arbeit wurde y = 0,25 angewendet. 


LRP-zP -Regel: Am Eingang des neuronalen Netzes wird in dieser Ar- 
beit ein Bild übergeben. Die Pixel {x,} (hier in der allgemeinen Form 
{a;}) dürfen nur bestimmte Werte annehmen. Die Berücksichtigung einer 
solchen Einschränkung bei der Suche nach der Entwicklungsstelle führt 
zur LRP-z”-Regel. Die Regel für die Rückpropagation der Relevanz lautet 
dann [Mon+17]: 


+ 


R; = 


j 


+ ijẹ 
í Žij = lwg = h;w 


íj 

mit l;, dem niedrigsten und h;, dem höchsten Wert des Kanals des Bildes. 
Diese Regel wird nur verwendet, um die Relevanzwerte der Neuronen der 
ersten verdeckten Schicht zurück in den Eingangsraum zu propagieren, 
also für die Berechnung von {R,} = IR, 


A.4.1 Kombination der Regeln 


Wie von Montavon et al. [Mon+19] vorgeschlagen, werden die obigen 
Regeln kombiniert, um ihre jeweiligen Vor- und Nachteile auszuglei- 
chen. Die Architektur der visualisierten CNN-Klassifikatoren wurde in 
Abschnitt 5.1.2 erläutert. Die LRP-O-Regel wird für die vollständig verbun- 
dene Schicht, die die 256 Neuronen nach dem GAP mit den Ausgängen 
verknüpft, verwendet. In den Blöcken 3 und 4 wird die LRP-e-Regel ein- 
gesetzt. In den Blöcken 1 und 2 kommt die LRP-y-Regel zur Anwendung. 
Ergänzt werden diese drei Regeln durch die LRP-z”-Regel, die für die 
Rückpropagation von der ersten Faltungsschicht auf den Eingangsraum 
verwendet wird, da man in diesem Fall den Wertebereich kennt. 
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A.5 Analyse weiterer Einflussgrößen auf die 
Grathöhe 


In diesem Abschnitt wird untersucht und diskutiert, ob es einen systema- 
tischen Zusammenhang zwischen der Kante mit dem höchsten Grat und 
einer der folgenden Einflussgrößen gibt. 


Schnittrichtung Kante 1 weist bei 30 % aller Teile die maximale Grathöhe 
auf. Kante 4 bei 27 %, Kante 3 bei 24% und Kante 2 bei 19% der Teile. Es 
scheint also ein schwacher Zusammenhang zwischen der Schnittrichtung 
und der Grathöhe zu bestehen. Ein Einfluss, der sich mit der Richtung 
überlagert, ist die Reihenfolge der Kanten. Der Strahl wird vor Kante 1 
eingeschaltet, bleibt dann an und wird nach Kante 4 ausgeschaltet, damit 
der Schneidkopf zum nächsten Teil bewegt werden kann. Um beide Ein- 
flüsse zu trennen, müsste man die Kanten in einer anderen Reihenfolge 
schneiden. 


Walzrichtung Bei Betrachtung der Walzrichtung werden die Kanten 1 
und 3 bzw. 2 und 4 zusammengefasst. 1 und 3 wurden quer zur Walz- 
richtung des Blechs geschnitten, 2 und 4 parallel dazu. Die Differenz ist 
hier mit 54% (maximale Grathöhe auf Kante 1 oder 3) und 46 % (maxi- 
male Grathöhe auf Kante 2 oder 4) sehr gering. Ein Einfluss, der sich mit 
der Walzrichtung überlagert, ist die Position der Stege. Diese sind in der 
Maschine orthogonal zur Walzrichtung angebracht und verändern (mögli- 
cherweise) die Gasdynamik. Um beide Einflüsse zu trennen, könnte man 
kleinere Blechtafeln verwenden und diese um 90° gedreht auf die Stege 
auflegen, sodass deren Walzrichtung entlang der Stege verläuft. 


Blechtafel Die 899 Teile wurden aus insgesamt vier Blechen ausgeschnit- 
ten. Für die Teile 1 bis 250 wurde Blech 1 benutzt, die Teile 251 bis 550 
wurden auf Blech 2 geschachtelt, für die Teile 551 bis 850 wurde Blech 3 
und für die Teile 851 bis 1126 Blech 4 verwendet. Der Zusammenhang zwi- 
schen dem verwendeten Blech und der Kante mit der maximalen Grathöhe 
istin Abbildung A.3(a) gezeigt. Kante 1 weist auf drei der vier Blechtafeln 
am häufigsten die größte Grathöhe auf, Kante 2 am seltensten. Nur Blech 
4 passt nicht in diese Systematik, dort ist die Grathöhe von Kante 4 am 
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häufigsten die größte. Nichtsdestotrotz scheint das Blech einen eher gerin- 
gen Einfluss zu haben. Da die Materialeigenschaften des Werkstoffs nicht 
im Detail bekannt sind, kann man von der Kenntnis der Zusammenhänge 
in den Blechen 1, 2, 3 und 4 auch nicht auf das Verhalten in einem weiteren 
Blech schließen. Eine mit dem Blech korrelierende Größe ist der Zeitpunkt 
des Schneidens, da die Bleche nacheinander geschnitten wurden. 


Position auf dem Blech (Zeilen, Spalten) Auf eine Blechtafel der Lange 
300 cm und der Breite 150 cm passen 25 Reihen bzw. 12 Spalten mit Teilen 
unter- bzw. nebeneinander (siehe Abbildung 4.2(b)). Es kommt teilweise 
zu deutlichen Unterschieden zwischen den Reihen, was die Kante mit der 
maximalen Grathöhe anbelangt. Während beispielsweise in Reihe 21 44 % 
der Teile auf Kante 4 die maximale Grathöhe aufweisen, sind es in Reihe 
17 nur 11 %. Es ist jedoch kein systematischer Zusammenhang zwischen 
Reihe und Grathöhe erkennbar. Der Zusammenhang mit der Spalte ist in 
Abbildung A.3(b) gezeigt. Auffällig sind vor allem die Spalten 2 und 11, 
also die jeweils zweiten Spalten von außen. Während in Spalte 2 nur bei 
11% aller Teile der höchste Grat auf Kante 1 anzutreffen ist, sind es bei 
Spalte 11 40%. Um eine fundiertere Aussage treffen zu können, müsste 
man die Position jedes einzelnen Teils sehr viel genauer erfassen, da diese 
davon abhängt, wie genau die Blechtafel auf die Palette gelegt wurde. 
Zusätzlich müsste man die Position der Stege und Stegspitzen vermessen. 


Zeitpunkt des Schneidens, Maschinenlaufzeit Es konnte kein systema- 
tischer Zusammenhang zwischen der Kante mit dem größten Grat und 
dem Zeitpunkt des Schneidens bzw. der Maschinenlaufzeit festgestellt 
werden. Es ist also nicht davon auszugehen, dass die verschieden ho- 
hen Grate durch langsame thermische Einflüsse, wie die Erwärmung des 
Schneidkopfs durch Streustrahlung, entstehen. 


Prozessparameter Die Prozessparameter beeinflussen die Grathöhe 
nicht nur direkt, sondern sie scheinen auch einen Einfluss darauf zu haben, 
an welcher Kante der Grat besonders ausgeprägt ist. In den Abbildungen 
A.3(c) und A.3(d) sind die Zusammenhänge mit dem Vorschub und der 
Fokusposition gezeigt. Beim Vorschub ist die Grathöhe für den LTT-Wert 
von 21 m/min besonders oft auf Kante 1 maximal. Große Grathöhen auf 
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Abbildung A.3 Zusammenhang zwischen der Kante mit der maximalen Grathöhe und 
verschiedenen Einflussgrößen. 


Kante 2 nehmen mit steigendem Vorschub eher ab, auf Kante 4 dagegen 
eher zu. Die maximale Grathöhe auf Kante 3 ist mit Anteilen von 21 % bis 
29 % relativ stabil. Bei der Fokuslage sollte man die Extremwerte von -3,0 
und 2,5 mm aufgrund der geringen Datengrundlage außer Acht lassen. 
Erkennbare Tendenzen sind ein überdurchschnittlich niedriger Anteil von 
Kante 1 im Bereich des LTT-Werts von -0,5 mm. Kante 4 verhält sich ge- 
genläufig. Die Gründe für dieses Verhalten sind jedoch unklar. 


Des Weiteren wurde nach einem Zusammenhang zwischen den oben- 


stehenden Einflüssen und der Grathöhe gesucht. Eindeutige Zusammen- 
hänge konnten nicht identifiziert werden. 
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A.6 Modellierung der Rautiefe 


Die folgenden Abbildungen A.4, A.5 und A.6 dienen als Ergänzung der in 
Abschnitt 6.4.3.1 präsentierten Ergebnisse. Sie zeigen die Zusammenhänge 
zwischen den Prozessparametern und der Rautiefe auf den Messlinien 03, 
15 und 27. 
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(c) Fokusposition —0,5 mm, Gasdruck 15 bar. (d) ADB 1,5 mm, Fokusposition —0,5 mm. 


Abbildung A.4 Güte verschiedener Modelle für die Prädiktion der Rautiefe auf Messlinie 
03: (a). Mit dem Modell 4. Grades berechnete Rautiefe: (b), (c), (d). 


186 


A.6 Modellierung der Rautiefe 


5,0 
gas 
= 
= 4,0 

m 3,5 


S 3,0 


2,5 


Grad 
(a) Mittlerer absoluter Fehler fiir verschiedene po- 


lynomiale Erweiterungen. 


Rautiefe in um 


3,0 
E25 
en 
m 157 
= 

0,5 


13 17 21 25 29 
Vorschub in m/min 


(c) Fokusposition —0,5 mm, Gasdruck 15 bar. 


Fokusposition in mm 


Gasdruck in bar 


Rautiefe in um 
aT 
10 20 30 40 50 60 70 


13 17 21 25 29 
Vorschub in m/min 


(b) ADB 1,5 mm, Gasdruck 15 bar. 
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(d) ADB 1,5 mm, Fokusposition —0,5 mm. 


Abbildung A.5 Güte verschiedener Modelle für die Prädiktion der Rautiefe auf Messlinie 
15: (a). Mit dem Modell 4. Grades berechnete Rautiefe: (b), (c), (d). 
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Abbildung A.6 Güte verschiedener Modelle für die Prädiktion der Rautiefe auf Messlinie 
27: (a). Mit dem Modell 4. Grades berechnete Rautiefe: (b), (c), (d). 
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